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数据 库 设计 是 数据 库 技术 的 一 个 重要 方面 。 目 前 有 很 多 书籍 介绍 数据 库 的 理论 知识 ， 但 能 与 实际 应 用 紧密 结 
合 的 实用 性 书籍 却 相对 较 少 。 本 书 作者 具有 丰富 的 数据 库 设计 和 教学 经 验 ， 以 通俗 易 懂 的 语言 描述 了 分 析 ， 设计 
实现 数据 库 的 整个 设计 过 程 ， 因 此 本 书 是 一 本 真正 意义 上 的 数据 库 理论 与 实践 相 结 合 的 书籍 ， 可 用 于 数据 库 基 
础 理论 之 后 的 后 续 学 习 


本 书 主题 

@ ”数据库 的 基本 知识 和 相关 概念 

全 面 介 绍 数据 库 设计 方法 学 

用 实例 引导 读者 掌握 从 需求 分 析 、 逻 辑 建 模 到 物理 实现 的 全 过 程 

包含 常用 应 用 领域 的 数据 模型 ， 读 者 可 以 在 此 基础 上 建立 自己 的 数据 模型 
用 UML 表 示 法 创建 数据 模型 的 方法 


第 2 版 的 新 增 内 容 

@ 添加 了 关于 SQL 和 QBE、 数 据 库 管理 和 安全 以 及 数据 库 领 域 的 现状 和 趋势 的 章节 ， 使 本 书 的 内 容 更 加 全 面 和 
先进 

@ 对 数据 库 设 计 方 法 论 的 内 容 进行 了 更 新 

@ ”本 书 的 配套 教学 材料 包含 StayHome 数 据 库 的 实现 ， 示 例 数据 模型 的 SQL 脚 本 ， 本 书 练习 的 样 例 解决 方案 等 
读者 可 以 到 华章 网 站 下 载 
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本 书 详细 介绍 数据 库 的 分 析 、 设 计 、 实 现 方法 和 过 程 。 本 书 不 仅 涵盖 普通 数据 库 书 籍 
中 所 没有 讲 到 的 数据 库 分 析 、 设 计 和 执行 过 程 ， 还 通过 贯穿 全 书 的 实例 描述 数据 库 的 创建 、 
监控 和 调整 的 全 过 程 。 主 要 内 容 包 括 数据 库 的 相关 知识 ， 数据库 分 析 和 设计 技术 、 逻 辑 数 
据 库 设计 方法 学 、 物 理 数据 库 设 计 方 法 学 等 内 容 。 另 外 ， 本 书 还 增加 了 SQL 和 QBE、 数 据 
库 管理 和 安全 性 以 及 数据 库 的 现状 和 趋势 等 内 容 ， 使 内 容 更 为 全 面 。 本 书 既 适合 作为 高 等 
院 校 数 据 库 课程 的 教材 ， 也 适合 相关 技术 人 员 作 为 数据 库 分 析 、 设 计 和 开发 的 参考 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 摹 出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰 出 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 畏 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 讲 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 租 努 力 ， 我 们 与 
Prentice Hall，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 上 刻 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛 节 ” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 秤 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。. 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ,教育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 一 个 新 的 阶段 。 为 此 ， 华 章 公 司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
全 美 经 典 学 习 指导 系列 "。 为 了 保证 这 三 套 从 书 的 权威 性 ， 间 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 晶 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 学 ， 中 国 
人民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 丛书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. 工 工 ，Stanford，U.C. Berkeley，C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 软件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 误 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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随 着 计算 机 技术 的 飞速 发 展 和 信息 管理 领域 的 日 益 扩 大 ， 数 据 库 技术 得 到 了 空前 的 发 展 ， 
数据 库 技术 的 应 用 领域 也 日 趋 扩大 和 深入 。 数 据 库 是 用 科学 的 方法 管理 和 组 织 数据 的 技术 ， 
是 计算 机 科学 的 一 个 重要 分 支 。 

本 书 主要 讲述 数据 库 设计 方法 学 。 全 书 由 六 个 部 分 和 五 个 附录 组 成 。 

第 一 部 分 由 第 1 章 ~ 第 5 章 组 成 ， 分 别 介绍 关系 数据 模型 、 使 用 SQL 和 QBE 查 询 数据 、 数 据 
库 系统 开发 生命 周期 以 及 数据 库 的 管理 和 安全 。 

第 二 部 分 由 第 6 章 ~ 第 8 章 组 成 ， 介 绍 设计 数据 库 首先 要 做 的 事情 : 事实 发 现 ， 其 中 包括 事 
实 发 现 所 使 用 的 技术 和 方法 ， 整 理 所 发 现 的 事实 并 建立 数据 库 模型 的 方法 以 及 如 何在 数据 模 
型 的 基础 上 设计 规范 化 的 关系 数据 库 表 的 方法 。 

第 三 部 分 由 第 9 章 ~ 第 1 章 组 成 ， 第 9 章 全 面 概述 本 书 使 用 的 数据 库 设 计 方 法 学 技术 ， 并 着 
重 介绍 方法 学 中 步骤 1 中 的 任务 一 一 构建 ER 模型 的 方法 ， 第 10 章 介绍 方法 学 中 步 晴 2 的 任务 ， 
即 如 何 将 ER 模型 映射 为 关系 数据 库 的 表 ， 第 11 章 介绍 高 级 ER 建 模 技 术 。 

第 四 部 分 由 第 12 章 ~ 第 16 章 组 成 ， 其 中 第 12 章 介绍 方法 学 中 的 步骤 3 ， 也 就 是 物理 数据 库 
设计 的 第 1 个 步骤 ,在 这 个 步 又 中 将 逻辑 数据 库 设 计 转 换 为 目标 DBMS 支 持 的 物理 数据 库 设 计 。 
第 13 章 介绍 方法 学 中 的 步骤 4， 也 就 是 物理 数据 库 设 计 的 第 2 个 步 骆 ， 在 读 章 中 介绍 如 何 分 析 
和 实现 用 户 的 事务 以 及 如 何 选择 合适 的 数据 库 文件 的 组 织 方式 和 索引 以 提高 系统 的 性 能 。 第 
14 章 介绍 物理 数据 库 设 计 的 后 两 个 步骤 一 一 步骤 $ 和 步骤 6， 内 容 包括 如 何 设计 用 户 视图 以 及 
如 何 设计 数据 库 安全 性 机 制 。 

第 五 部 分 由 第 17 章 和 第 18 章 组 成 ， 该 部 分 通过 第 二 个 示例 一 一 宠物 诊所 的 例子 ， 再 次 演 
示 了 数据 库 方法 学 中 届 辑 数据 库 设计 和 物理 数据 库 设 计 的 各 个 步 又 的 使 用 。 

第 六 部 分 由 第 19 章 组 成 ， 该 章 介 绍 一 些 高 级 数据 库 应 用 ， 讨 论 关系 模型 的 局 限 性 ， 介 绍 
分 布 式 数据 库 管理 系统 。 面 向 对 象 数据 库 管理 系统 、 对 象 -关系 数据 库 管理 系统 、 数 据 仓 库 、 
联机 分 析 处 理 和 数据 挖掘 的 主要 概念 ， 最 后 提出 将 数据 库 技术 与 Web 技 术 集成 起 来 的 一 些 方 
法 。 





附录 A 介 绍 其 他 一 些 较 常 用 的 表示 数据 模型 的 方法 。 附 录 B 对 本 书 所 介绍 的 数据 库 设计 方 
法 学 中 的 步 又 进行 归纳 和 总 结 ， 便 于 读者 快速 参考 和 查阅 。 附 录 C 介 绍 设计 复杂 数据 库 时 可 以 
先 设 计 局 部 逻辑 数据 模型 ， 然 后 再 将 这 些 局 部 模型 合并 为 一 个 全 局 模型 的 方法 。 附 录 D 介 绍 _- 
些 常用 的 数据 库 文 件 和 索引 的 组 织 方 式 。 附 录 E 介 绍 15 个 常用 应 用 领域 的 数据 模型 的 建立 ， 方 
便 读 者 在 解决 类 似 问 题 时 进行 参考 。 

本 书 的 作者 从 事 过 多 年 的 数据 库 方面 的 工作 ， 具 有 丰富 的 数据 库 设 计 和 使 用 经 验 ， 因 此 
本 书 的 特点 就 是 数据 库 技术 与 实际 的 应 用 的 结合 非常 密切 ， 弥 补 了 现在 很 多 数据 库 图 书 中 理 
论 知识 介绍 很 丰富 ， 但 结合 实际 情况 解决 实际 问题 的 介绍 却 不 够 丰富 的 缺点 。 由 于 本 书 的 作 
者 具有 很 丰富 的 数据 库 设 计 、 开 发 和 使 用 的 经 验 ， 因 此 书 中 介绍 的 内 容 非 常 有 效 和 实用 ， 间 
常 适合 数据 库 设 计 人 员 使 用 。 

本 书 的 另 一 个 特点 就 是 将 抽象 、 枯 燥 的 数据 库 设计 方法 用 一 个 很 容易 理解 的 例子 贯穿 起 
来 ， 通 过 这 个 例子 逐渐 展开 ， 直 至 使 用 完 数据 库 设计 方法 学 的 全 部 步 又 ， 因 此 容易 激发 读者 
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的 阅读 兴趣 ， 也 能 使 读者 更 好 地 理解 这 些 方法 学 的 运用 。 企 读者 已 经 基本 熟悉 了 这 些 方法 学 
的 过 程 之 后 ,再 举 出 第 二 个 例子 ， 第 二 个 例子 又 -次 完全 用 到 了 前 边 介绍 的 方法 学 步骤 ， 使 
读者 进一步 加 深 对 方法 学 的 理解 。 此 外 ， 本 书 图 文 并 茂 ， 读 者 能 很 直观 地 理解 数据 库 设 计 的 
概念 和 方法 。 

本 书 的 第 2 版 在 第 1 版 成 功 的 基础 之 上 ， 又 添加 了 SQL 和 QBBE、 数 据 库 管理 和 安全 性 以 及 
数据 库 的 现状 和 未 来 趋势 方面 的 内 容 ， 并 将 第 1 版 的 第 10 章 放 在 了 第 2 版 的 附录 C 中 ， 使 全 书 的 
结构 更 加 合理 、 条 埋 更 清晰 。 同 时 ， 对 第 1 版 大 部 分 意 千 的 内 容 进行 了 调整 ， 增 加 了 一 些 新 的 
知识 ， 去 掉 了 第 1 版 中 的 一 些 过 时 的 内 容 。 尤 其 是 在 第 ?版 中 增加 的 第 5 章 更 强调 了 数据 亩 安全 
的 重要 性 ， 第 19 章 客观 地 分 析 了 当前 数据 库 技术 发 展 的 几 个 方向 。 有 利于 读者 对 数据 库 技术 
有 更 全 面 的 了 解 。 

本 书 适 合 有 一 定数 据 库 理 论 基 础 ， 又 希望 能 将 理论 知识 应 用 到 实际 使 用 过 程 中 的 读者 阅 
读 ， 尤 其 适合 那些 在 设计 数据 库 时 不 知 从 何 下 手 或 者 经 验 不 足 的 数据 库 设计 新 手 阅读 。 本 书 
可 作为 数据 库 理 论 知识 的 后 续 学 习 内 容 ， 也 可 作为 高 等 院 校 数据 库 课程 的 教材 或 数据 库 设计 
和 开发 人 员 的 数据 库 设计 参考 书 。 

本 书 由 何 玉 洁 负责 组 织 翻译 和 审 校 ， 主 要 由 何 玉 洛 和 黄 婷 儿 完成 ， 梁 琦 、 崔 输 、 卢 立 能 、 
何 琅 书 、 李 迎 等 参加 了 本 书 部 分 章节 的 审 校 工作 。 

由 于 译 者 水 平 有 限 ， 在 译 校 过 程 中 准 免 出 现 跑 漏 和 不 妥 之 处 ， 嫩 请 读者 批评 指正 。 


何 玉 洁 
2004 年 9 月 





前 言 
背景 
如 今 ， 数 据 库 是 信息 系统 的 基本 框 保 并 且 从 根本 上 改变 了 许多 公司 和 个 人 的 工作 方式 。 


数据 库 技 术 经 过 多 年 的 发 展 已经 创造 出 更 强大 、 更 易 用 的 数据 库 系统 ， 使 用 户 无 需 具 备 开 发 
高 效 系统 的 知识 便 可 创建 数据 库 并 实现 其 应 用 。 目 前 的 参考 文献 中 ， 有 许多 优秀 的 、 曾 述 数 
据 库 的 部 分 发 展 生 命 周 期 的 著作 。 然 而 ， 我 们 发 现 很 少 有 书籍 介绍 数据 库 的 分 析 、 设 计 以 及 
执行 ， 并 且 很 少 有 书籍 采用 专业 和 非 专业 读者 都 易 懂 的 方式 描述 数据 库 的 开发 过 程 。 

因此 ， 本 书 的 创作 初衷 是 尽 可 能 清楚 地 为 读者 解释 如 何 分 析 、 设 计 及 实现 数据 库 ， 包 括 
从 仅 含 儿 张 表 的 简单 数据 库 到 包括 数 十 至 数 百 张 表 的 大 型 数据 库 。 实 际 上 本 书 对 进行 理论 研 
究 的 人 七 也 非常 有 用 ， 而 且 简 单 明 了 地 曾 述 了 数据 库 设 计 的 方法 学 。 

礁 书 所 介绍 的 用 于 关系 数据 库 管理 系统 (当今 商业 应 用 中 的 主要 系统 ) 的 方法 学 已 经 通 
过 业界 和 学 术 界 多 年 的 检验 。 这 种 方法 学 分 为 两 个 阶段 : 

* 逻辑 数据 库 设 计 人 阶段。 在 这 个 阶段 ， 我 们 开发 一 个 模型 来 摘 述 所 需要 的 内 容 ， 并 名 略 实现 的 细节 。 

“物理 数据 库 设 计 阶段 。 在 这 个 阶段 ， 我 们 确定 如 何在 目标 数据 库 管 理 系 统 (DBMS ) 实 

现 这 些 需 求 ， 如 Microsoft Access、Microsoft SQL Server、Oracle、DB2 和 Informix 。 

我 们 为 每 个 阶段 都 提供 了 易学 的 步骤 ， 缺 乏 经 验 的 设计 者 可 以 按照 所 提供 的 步骤 进行 学 
习 。 此 外 ， 一 些 指导 方针 也 可 以 用 于 完成 这 个 学 习 过 程 。 对 于 经 验 丰 富 的 设计 者 ， 这 种 方法 
学 更 多 地 成 为 了 一 种 框架 或 者 恰 查 列表 ， 而 其 说 明 性 则 极 少 。 


帮助 理解 数据 库 的 设计 


为 了 帮助 读者 应 用 方法 学 、 理 解 重要 的 问题 ， 我 们 提供 了 -个 综合 的 工作 示例 ， 该 示例 
是 基于 一 家 称 为 StayHome 的 录像 出 租 公司 ， 这 个 示例 将 贯穿 本 书 始终 。 为 更 完善 地 补充 方法 
学 ， 我 们 在 第 17 章 和 第 18 章 中 选取 了 另外 一 个 名 为 Perfect Pets 的 宠物 诊所 作为 示例 。 

为 了 帮助 读者 理解 得 更 加 深入 ， 我 们 在 附录 E 增 加 了 数据 库 的 解决 方案 (相应 的 SQL 脚本 
包含 在 相应 的 Web 站 点 上 )。 每 个 方案 都 有 一 个 简短 的 介绍 ， 读 者 可 以 参照 这 个 介绍 ， 在 阅读 
样 例 之 前 试 着 自己 进行 数据 库 的 设计 。 


常见 的 数据 模型 


在 提供 数据 库 设计 经 验 的 同时 ， 附 录 E 还 提供 了 许多 常见 的 且 有 用 的 数据 模型 。 实 际 上 ， 
据 统 计 约 有 1/3 的 数据 模型 包含 了 适用 于 大 多 数 公司 的 公共 结构 ， 而 其 余 的 2/3 则 用 于 特殊 产业 
或 者 特殊 单位 。 因 此 ， 大 多 数 数据 库 设 计 工作 包含 了 重建 那些 被 其 他 公司 创建 了 多 次 的 结构 ， 
这 些 具 有 特征 性 的 模型 也 许 并 不 能 完全 地 满足 你 的 公司 的 需求 ， 但 是 ， 它 们 可 以 作为 开发 的 起 
点 ， 在 此 基础 上 ， 你 可 以 建立 更 适合 本 公司 特殊 需要 的 模型 。 我 们 所 提供 的 模型 覆 益 了 以 下 的 
常见 业务 领域 : : 

* 消费 者 订购 。 





* 库存 控制 。 
" 资产 管理 。 
"项 目 管理 。 
“课程 管理 。 
。 人 力 资源 管理 。 
“ 工资 管理 。 


统一 建 模 语 言 


越 来 越 多 的 公司 正在 采用 标准 化 的 方法 。 使 用 标准 化 的 方法 ， 他 们 可 以 选择 一 种 特定 的 
方法 进行 数据 建 模 ， 并 将 这 种 方法 贯穿 于 数据 库 开 发 过 程 的 始终 。 本 书 采用 一 种 常用 于 逻辑 
数据 库 设 计 的 高 级 数据 模型 ， 这 种 模型 是 建立 在 实体 -关系 (ER) 概念 上 的 模型 。 目 前 ，ER 
模型 没有 标准 的 表示 法 。 大 多 数 书籍 在 提 及 关系 数据 库 管理 系统 (DBMS) 的 数据 库 设 计时 
会 用 到 以 下 两 种 传统 的 表示 法 之 一 : . 

“ Chen 氏 表 示 法 ， 它 由 代表 实体 的 抢 形 和 代表 关系 的 凌 形 以 及 连接 矩形 和 菱形 的 连 线 组 

成 。 

"Srow 的 Feet (标注 ) 表示 法 ， 它 由 代表 实体 的 矩形 以 及 代表 实体 间 关 系 的 连 线 组 成 。 连 

线 一 端的 标注 代表 一 对 多 的 关系 。 

当今 的 CASE 工 具 能 很 好 地 支持 这 两 种 表示 法 。 但 是 ， 它 们 应 用 起 来 比较 麻烦 而 且 难 以 解 
释 。 在 本 书 中 ， 我 们 采用 最 新 的 面向 对 象 建 模 语言 中 的 类 图 表示 法 ， 这 种 建 模 语言 称 为 UML 
(Unified Modeling Language， 统 一 建 模 语言 )。UML 表 示 法 结合 了 三 种 主要 的 面向 对 象 设计 的 
要 素 : Rumbaugh 的 OMT 建 模 ，Booch 的 面向 对 象 分 析 和 设计 以 及 Jacobson 的 对 象 论 。 可 以 预计 ， 
UML 将 会 成 为 一 种 标准 ， 而 且 对 象 管理 组 (OMG) 已 经 采用 了 UML 作 为 对 象 方法 的 标准 表示 
法 。 

我 们 相信 这 种 表示 法 更 易于 理解 和 使 用 。 

第 2 版 新 增 内 容 


本 书 第 2 版 对 第 1 版 进行 了 修订 ， 增 加 了 可 读 性 ， 更 新 或 扩展 了 现 有 的 一 些 内 容 ， 并 引入 
了 一 些 新 的 内 容 。 第 2 版 中 主要 的 变化 包括 : 

“新 增 一 章 介绍 SQL (Structured Query Language， 结 构 化 查询 语言 ) 和 QBE (Query-by- 

Example )。 SQL 和 QBE 是 关系 DBMS 中 最 主要 的 两 种 语言 。 

“新 增 一 章 介 绍 数据 库 管 理 和 安全 性 。 

“改进 了 数据 库 涉及 方法 学 。 特 别 的 ， 将 用 户 视图 从 逻辑 数据 库 设计 中 移 到 了 附录 中 ， 以 

保持 基本 的 方法 学 的 简单 性 。 


数据 库 未 统 不 能 很 好 地 适应 这 些 需 求 ， 然 后 介绍 了 分 布 式 数据 库 管理 系统 、 数 据 复制 、 
面向 对 象 数据 库 管理 系统 、 对 象 - 关 系数 据 库 管理 系统 、 数 据 仓库 、 联 机 分 析 处 理 
(OLAP) 和 数据 控 据 的 概念 ， 以 及 将 数据 库 集成 到 Web 环 境 中 的 方法 。 

“ 在 大 多 数 章 的 最 后 通过 提出 一 些 问 题 对 本 章 内 容 进行 回顾 ， 并 在 本 书 网 站 中 提供 一些 加 
顾问 题 、 练 习 、 铀 试问 题 、 幻 灯 片 、 数 据 库 和 附录 E 中 常见 数据 模型 的 SQL 脚本 。 
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说 明 怎 样 执行 一 个 设计 

我 们 认为 说 明 怎样 将 数据 库 设 计 转 换 为 物理 实现 是 非常 重要 的 。 在 本 书 中 ， 我 们 说 明了 
如 何 用 Microsoft Access 2002 DBMS 实 现 第 一 个 示例 (名 为 StayHome 的 录像 租借 公司 )， 第 二 
个 示例 (名 为 Perfect Pets 的 宠物 诊所 ) 说 明了 如 何在 Oracle 9i1 DBMS 中 实现 数据 库 设 计 。 
本 书 的 读者 对 象 

哪些 人 应 该 阅读 本 书 ? 我 们 试图 以 独立 的 方式 编写 这 本 书 ,但 物理 数据 库 设 计 是 个 例外 ， 
因为 在 这 一 部 分 ， 你 应 该 很 好 地 理解 目标 数据 库 管理 系统 是 怎样 运转 的 。 我 们 的 读者 就 是 那 
些 希 望 开 发 数据 库 的 人 ， 包 括 如 下 但 并 非 仅 仅 如 下 所 示 的 一 些 人 : 

。 信息 模型 设计 者 和 数据 库 设 计 者 。 

。 数据库 应 用 设计 者 和 实现 者 。 

。 数据 库 制 造 商 。 

*“ 数据 和 数据 库 管理 者 。 

* 信息 系统 ,商业 IT 以 及 专门 从 事 数据 库 设 计 的 学 者 。 

"数据 库 专业 的 学 生 ， 包 括 大 学 生 和 研究 生 。 

。 和 希望 设计 并 开发 数据 库 应 用 的 人 。 


本 书 的 结构 


本 书 共有 六 个 部 分 和 五 个 附录 : . 

* 第 一 部 分 一 一 相关 知识 介绍 。 在 第 1 章 和 第 2 章 ， 我 们 介绍 了 数据 库 管 理 系统 和 关系 模型 。 
第 3 章 提供 了 数据 库 应 用 生命 周期 的 概述 。 在 第 4 章 提 供 了 数据 库 系 统 开发 生命 周期 的 概 
述 ， 在 第 5 章 讨 论 了 数据 库 管 理 和 安全 性 。 

“第 二 部 分 一 一 数据 库 分 析 与 设计 技术 。 我 们 在 第 6 章 讨 论 了 数据 库 分 析 技 术 ， 说 明了 怎 
样 用 其 中 的 一 些 技术 来 分 析 录 像 租借 公司 StayHome 的 需求 。 在 第 7 章 说 明了 怎样 用 UML 
画 实体 ~ 关系 (ER) 图 。 怎 样 应 用 规范 化 规则 的 内 容 将 在 第 8 章 中 阐述 。 ER 模型 和 规范 
化 都 是 第 三 部 分 描述 的 数据 库 设计 方法 学 中 非常 重要 的 技术 。 

"第 三 部 分 逻辑 数据 库 设 计 。 我 们 用 循序 渐进 的 方式 描述 了 逻辑 数据 库 设计 的 方法 。 
第 1 步 在 第 9 章 描述 ， 在 这 一 步 ， 我 们 为 StayHome 录 像 租借 公司 创建 一 个 ER 模型 。 第 2 步 
在 第 10 章 介绍 ， 在 这 一 步 ， 我 们 将 ER 模型 映射 为 数据 库 的 表 集 。 为 支持 更 复杂 的 数据 
库 设计 ， 我 们 在 第 11 章 提出 了 与 增强 ER 建 模 有 关 的 主要 概念 ， 这 一 章 同 时 描述 了 如 何 
将 这 些 概念 映射 到 表 中 。 

“第 四 部 分 一 -物理 数据 库 设计 。 我 们 依然 用 循序 渐进 的 方式 描述 物理 数据 库 设计 的 方法 
第 3 步 在 第 12 章 介绍 ， 这 里 我 们 为 目标 DBMS 设 计 一 些 基本 表 。 第 4 步 在 第 13 章 介绍 ， 这 
下 我 们 逸 择 文件 的 组 织 和 索引 。 在 第 14 章 介绍 第 5 步 和 第 6 步 ， 我 们 考虑 用 户 视图 的 设计 
以 及 安全 性 机 制 的 设计 ， 以 防止 数据 被 未 授权 访问 。 在 第 15 音 介绍 步 又 7， 我 们 描述 了 
如 何 引 入 受 控 的 数据 元 余 以 获得 更 好 的 数据 库 性 能 。 最 后 ， 在 第 16 章 介绍 第 8 步 ， 我 们 
监视 并 调整 操作 系统 。 正 如 我 们 刚刚 提 到 的 ， 我 们 将 告诉 你 如 何在 Microsoft Access 
2002 中 完成 StayHome 数 据 库 系 统 的 设计 。 . 

“第 五 部 分 一 一 第 二 个 实例 。 第 二 个 穹 物 诊所 示例 贯穿 于 第 17 章 和 第 18 章 。 我 们 将 说 明 怎 
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样 在 Oracie 9i 中 实现 Perfect Pets 数据 库 的 设计 。 

* 第 六 部 分 一 -数据 库 的 现状 和 未 来 趋势 。 在 第 19 章 ,我 们 讨论 了 高 级 数据 库 应 用 的 需求 ， 
以 及 为 什么 目前 的 关系 数据 库 系统 不 能 很 好 地 适应 这 些 需求 ， 然 后 我 们 介绍 了 分 布 式 数 
据 库 管理 系统 (DDBMS )、 数 据 复制 、 面 向 对 象 数据 库 管理 系统 (OODBMS )， 对 象 - 
关系 数据 库 管理 系统 (ORDBMS ) 、 数 据 仓库 、 联 机 分 析 处 理 (OLAP) 和 数据 挖掘 的 
概念 ， 以 及 将 数据 库 集成 到 Web 环 境 中 的 方法 。 

* 附录 。 附 录 A 说 明了 两 种 主要 的 ER 表示 法 : Chen 氏 表示 法 和 Crow 的 Feet 表 示 法 。 附 录 B 
提供 了 方法 学 的 总 结 以 供 参考 。 附 录 C 提 出 了 对 基本 逻辑 数据 库 设 计 方法 的 扩展 ， 这 主 
要 用 于 使 用 视图 集成 方法 管理 的 有 多 个 用 户 视图 的 数据 库 系统 。 附 录 D 提 供 了 -一些 文件 
组 织 和 存储 结构 的 背景 知识 ， 这 主要 用 于 帮助 读者 理解 在 第 三 部 分 提出 的 物理 数据 库 设 
计 方法 学 的 一 些 概念 。 附 录 E 提 供 了 15 个 常见 的 数据 模型 。 

教学 风格 

为 使 本 书 尽 可 能 易 读 ， 我 们 采用 了 下 述 风格 和 结构 : 

* 在 每 章 的 开始 都 对 该 章 主题 有 一 个 简单 而 清晰 的 描述 。 

* 在 每 章 结 束 的 小 结 部 分 ， 总 结 该 章 介 绍 的 主要 知识 点 。 

“在 大 多 数 章 的 最 后 有 复习 题 。 

* 所 介绍 的 每 个 重要 概念 都 有 清晰 的 定义 ， 并 放置 在 一 个 定义 框 中 。 

* 一 系列 的 注意 和 提示 信息 。 

“本 书 使 用 了 大 量 的 图 来 阐述 和 说 明 概念 。 

“ 实践 性 很 强 。 每 一 章 都 包含 许多 实用 的 例子 来 说 明 所 包含 的 观点 。 

“ 本 书 最 后 的 术语 表 对 于 快速 查找 是 非常 有 用 的 。 


相应 的 教师 指南 和 站 点 


根据 Pearson Education 的 要 求 ， 读者 可 从 网 站 上 获得 关于 本 书 的 一 个 全 面 的 补充 ， 其 中 包 
含 大 量 的 指导 性 的 资源 。 附 加 的 教师 指南 包括 : 

“ 讲授 建议 。 其 中 包括 授课 建议 、 授 课 提示 ， 以 及 利用 每 章 内 容 的 学 生 项 目 思 想 。 

* 解决 方案 。 提 供 了 所 有 复习 题 的 答案 示例 。 

“测试 题 。 测 试题 《类 似 于 每 一 章 最 后 的 复习 题 ) 以 及 解决 方案 。 

“幻灯 片 【使 用 PowerPoint 创 建 ) 。 包 含 每 一 章 的 主要 知识 点 、 放大 的 图 解 、 书 中 的 表 ， 

以 帮助 教师 授课 并 就 本 书 的 内 容 进行 课堂 讨论 。 

。StayHome 数 据 库 系 统 在 Microsoft Access 2002 中 的 实现 。 

* 创建 Perfect Pets 数 据 库 系 统 的 SQL 脚本 ， 这 个 脚本 可 用 于 在 许多 关系 DBMS 中 创建 数据 

库 ， 包 括 Oracle、 Informix 和 SQL Server。 | 

“所 有 在 附录 BE 中 定义 的 常用 数据 模型 的 SQL 脚本 ， 这 些 脚本 可 用 来 创建 数据 库 系统 的 基 

本 表 集 合 。 再 强调 一 次 ， 这 些 脚本 可 在 许多 关系 DBMS 中 使 用 。 

关于 教师 指南 和 本 书 可 以 在 Pearson Education 站 点 上 找到 ，Pearson Education 的 网 址 是 : 


http://www.booksites.net/connbe ge 
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第 1l 章 引 


` 本 章 主 题 : 

数据库 系统 的 一 般 用 途 。 

术语“ 数据 库 ” 的 含义 。 

。 术 语 “ 数 据 库 管理 系统 ”(DBMS ) 的 含义 。 

。*DBMS 环 境 的 主要 组 成 部 分 。 

。DBMS 的 典型 功能 与 服务 。 

"DBMS 的 优 缺 点 。 

现在 ， 数 据 库 已 经 成 为 我 们 每 天 生活 中 不 可 缺少 的 一 部 分 ， 虽 然 有 人 可 能 并 没 意 识 到 这 
一 点 。 在 开始 讨论 数据 库 之 前 ， 我 们 简要 地 介绍 一 些 数据 库 系统 的 应 用 。 为 了 方便 讨论 ， 我 
们 认为 “数据 库 ” 是 相关 数据 的 集合 ， 而 “数据 库 管 理 系 统 ”(Database Management System， 
DBMS) 是 管理 和 控制 对 数据 库 进行 访问 的 软件 ， 更 概括 的 术语 “数据 库 系 统 ” 是 指 与 数据 
库 相 关 的 应 用 程序 的 集合 。 在 12 节 中 ， 我 们 将 提供 更 精确 的 定义 。 在 本 章 未 尾 ， 我 们 将 介绍 
现代 DBMS 的 典型 功能 并 简要 地 介绍 DBMS 的 优 缺 点 。 


1.1 数据 库 系统 使 用 示例 


站 从 超市 购物 

当 你 从 当地 超市 购买 货物 时 ， 很 可 能 就 是 在 访问 数据 库 。 收 银 员 使 用 条 形 码 阅 读 器 来 扫 
描 你 的 每 种 货物 。 这 就 链接 了 一 个 使 用 条 形 码 从 产品 数据 库 中 查询 该 项 货物 价格 的 应 用 程序 ， 
然后 该 程序 产生 这 些 库存 项 目的 数量 ， 在 收银 机 上 显示 价格 。 如 果 记 录 产 品 的 数量 低 于 指定 
的 最 低 极限 值 ， 数 据 库 系统 可 能 会 自动 设置 一 个 订单 来 获得 更 多 的 该 产品 的 库存 。 

2. 使 用 信用 卡 购物 

当 你 使 用 信用 卡 购物 时 ， 服 务 人 员 要 检查 你 是 否 有 足够 的 剩余 金额 可 以 购买 该 商品 。 这 
种 检查 可 以 用 电话 来 进行 ， 或 者 也 可 以 用 连接 到 计算 机 系统 的 磁卡 阅读 器 自动 完成 。 无 论 是 
哪 种 情况 ， 都 在 某 一 个 地 方 有 一 个 数据 库 ， 此 数据 库 中 包含 了 你 使 用 信用 卡 进 行 购物 的 信息 。 


党 一 部 分 枸 关 却 职 介绍 


A 


为 了 检查 你 的 信用 卡 ， 存 在 一 个 数据 库 应 用 程序 ， 此 程序 使 用 你 的 信用 卡号 码 来 检查 你 想 购 
买 的 商品 的 价格 ， 以 及 你 这 个 月 已 经 购买 的 商品 的 总 额 是 否 在 信用 限度 内 。 当 购买 被 确认 有 
效 后 ， 则 这 次 的 购买 详细 信息 又 被 加 到 了 这 个 数据 库 中 。 在 确认 此 次 购买 生效 之 前 ， 这 个 应 
用 程序 也 会 访问 数据 库 ， 检 查访 信用 卡 是 否 在 被 次 或 丢失 列表 中 。 还 有 其 他 数据 库 应 用 程序 ， 
它们 向 每 个 持 卡 者 每 月 发 送 通知 ， 并 在 收 到 付款 后 汇 去 账单 。 

3. 在 旅行 社 预定 假期 

当 你 咨询 某 次 假期 的 安排 时 ， 旅 行 社 可 能 访问 几 个 包含 假期 和 飞机 的 详细 信息 的 数据 库 。 
当 你 预定 假期 时 ， 数 据 库 系 统 必 须 进 行 所 有 必要 的 预定 安排 。 在 这 种 情况 下 ， 该 系统 必须 要 
确保 不 同 的 代理 没有 预定 相同 的 假期 或 飞机 上 相同 的 座位 。 例 如 ， 如 果 在 从 伦敦 到 纽约 的 飞 
机 上 只 剩 下 一 个 座位 ， 两 个 代理 在 同一 时 间 预 定 这 最 后 一 个 座位 ， 系 统 不 得 不 处 理 这 种 情况 ， 
允许 一 个 预定 继续 ， 并 通知 另 一 个 代理 没有 位 置 了 。 通 常 ， 旅 行 代理 都 有 独立 的 用 来 记 账 的 
数据 库 。 

4. 使 用 图 书馆 

图 书馆 一 般 会 有 一 个 包含 所 有 图 书 的 详细 信息 的 数据 库 ， 其 中 的 信息 可 能 还 包括 读者 的 
信息 、 预 定 信息 等 等 。 可 能 会 允许 读者 基于 书 名 、 作 者 或 其 他 数据 查找 所 需 书籍 。 数 据 库 系 
统 可 能 会 允许 读者 预定 书籍 ， 并 在 书籍 可 以 借阅 时 发 邮件 通知 读者 。 该 系统 也 给 没有 按期 还 
书 的 借阅 者 发 提醒 通知 。 一 般 情况 下 ， 系 统 都 有 一 个 条 形 码 阅 读 器 ， 类 似 于 前 边 超 市 中 描述 
的 那 种 ， 用 来 记录 归还 和 借 出 图 书馆 的 书籍 。 

5. 出 租 录 像 

当 你 希望 从 录像 租借 公司 租 一 盘 录 像 时 ， 你 可 能 会 发 现 这 个 公司 维护 着 一 个 数据 库 ， 这 
个 数据 库 中 包括 关于 每 个 录像 的 片 名 、 录 像 有 几 份 拷贝 的 详细 信息 、 这 个 录像 目前 是 可 以 租 
借 的 还 是 已 经 被 借 出 了 、 它 的 成 员 (租借 者 ) 的 详细 信息 、 他 们 目前 正在 租借 的 录像 以 及 归 
还 日 期 。 这 个 数据 库 可 能 还 为 每 个 录像 存储 更 详细 的 信息 ， 比 如 它 的 导演 和 演员 。 这 个 公司 
可 以 使 用 这 个 信息 来 监视 库存 的 使 用 ， 并 根据 历史 的 租借 数据 预测 将 来 的 购买 倾向 。 例 如 ， 
图 1-1 说 明了 这 个 公司 的 一 些 示例 数据 。 
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图 1-1 录像 租借 公司 的 数据 示例 








6. 使 用 [Internet 

Internet 上 的 很 多 站 点 是 由 数据 库 应 用 程序 驱动 的 。 例 如 ， 你 可 能 访问 过 一 个 在 线 书店 ， 
这 个 书店 允许 借 书 和 买书 ， 比 如 Amazon.com。 这 个 书店 允许 你 按 不 同 种 类 借 书 ， 比 如 计算 或 
管理 ， 它 也 允许 你 按 作者 名 借 书 。 不 管 是 哪 种 情况 ， 在 这 个 机 构 的 Web 服 务 器 上 都 有 一 个 数 
据 库 ， 数 据 库 中 包含 了 图 书 的 详细 信息 、 获 得 方式 、 邮 寄 信 息 、 库 存 级 别 以 及 排列 信息 。 图 
书 详细 信息 包括 书 名 、ISBN、 作 者 、 价 格 、 销 售 历史 、 出 版 社 、 评 论 以 及 详细 的 描述 。 数 据 
库 人 允许 图 书 被 交叉 检索 ， 比 如 ， 一 本 图 书 可 以 列 在 几 个 种 类 中 ， 比 如， 计算 、 编 程 语言 、 畅 
销 书 以 及 被 推荐 图 书 等 。 交 叉 检 索 也 使 Amazon 可 以 给 你 一 些 其 他 图 书 的 信息 ， 这 些 图 书 一 般 
是 与 你 所 感 兴 趣 的 图 书 有 关 的 。 

这 只 是 儿 种 数据 库 系 统 应 用 ， 毫 无 疑问 ， 你 会 知道 其 他 许多 应 用 情况 。 尽 管 我 们 熟知 并 
常用 这 些 应 用 ,但 在 它们 的 背后 却 隐藏 着 复杂 的 高 级 技术 。 这 种 技术 的 核心 就 是 数据 库 本 身 。 
对 于 要 尽 可 能 有 效 地 支持 最 终 用 户 需求 的 系统 来 说 ， 需 要 合适 的 结构 化 数据 库 。 构 建 这 种 结 
构 就 是 所 说 的 数据 库 设 计 ， 这 也 是 本 书 讨论 的 核心 内 容 。 无 论 要 构建 的 是 小 型 的 数据 库 ， 还 
是 上 面 所 说 的 那 种 大 型 数据 库 ， 数 据 库 设计 都 是 基础 ， 本 书 中 提出 的 方法 学 将 帮 你 轻松 地 构 
建 正确 的 数据 库 。 拥 有 一 个 设计 优良 的 数据 库 可 以 使 你 构建 符合 用 户 需 求 的 系统 ， 同 时 提供 
可 接受 的 性 能 。 


1.2 数据 库 方法 
在 本 节 中 ， 我 们 为 术语 “数据 库 ” 和 “数据 库 管理 系统 ”提供 更 为 正式 的 定义 。 
1.2.1 数据 库 


数据 库 (Database ) 还 辑 上 相关 的 可 共享 的 数据 〔〈 以 及 数据 的 描述 ) 集合 ， 用 于 


处 理 公司 所 需 的 信息 。 


让 我 们 详细 分 析 数据 库 的 定义 以 便 全 面 理解 这 个 概念 。 数 据 库 是 一 个 巨大 的 数据 存储 地 ， 
可 以 同时 被 许多 部 门 和 用 户 使 用 。 这 些 用 户 所 需要 的 所 有 数据 用 最 小 的 元 余 集 成 在 一 起 。 更 
重要 的 是 ， 数 据 库 通常 不 属于 任何 一 个 部 门 或 用 户 ， 而 是 公司 内 的 共享 资源 。 

除了 存储 公司 的 数据 ， 数 据 库 也 存储 数据 的 描述 。 因 此 ， 数 据 库 也 定义 为 完整 记录 的 自 
描述 集合 。 数 据 的 描述 ， 也 就 是 元 数据 一 -关于 数据 的 数据 ， 被 称 为 系统 目录 或 数据 字典 。 
正 是 数据 库 的 自 描述 特性 提供 了 被 称 为 数据 独立 性 的 特点 。 这 就 意味 着 如 果 有 新 的 数据 结构 
要 加 入 到 数据 库 中 ， 或 者 要 修改 数据 库 中 已 经 存在 的 数据 结构 ， 那 么 如 果 应 用 程序 不 吾 接 依 
赖 于 被 修改 的 部 分 ， 则 对 使 用 该 数据 库 的 应 用 程序 来 说 没有 影响 。 例 如 ， 如 果 我 们 为 记录 添 
加 了 新 列 或 者 创建 了 新 表 ， 则 对 已 经 存在 的 应 用 程序 是 没有 影响 的 。 但 是 ， 如 果 从 一 个 应 用 
程序 使 用 的 表 中 删除 了 一 列 ， 那 么 这 个 应 用 程序 就 会 受到 这 个 变化 的 影响 ， 因 此 也 必须 相应 
地 进行 修改 。 

我 们 要 解释 的 数据 库 定义 中 的 最 后 一 个 术语 就 是 “逻辑 相关 ”。 当 我 们 分 析 了 公司 的 信息 
需求 乒 ， 我 们 尽力 去 标识 数据 库 中 要 描述 的 重要 对 象 和 这 些 对 象 之 间 的 逻辑 关系 。 我 们 提出 
的 数据 库 设计 方法 学 将 引导 你 标识 这 些 重要 的 对 象 和 它们 之 间 的 逻辑 关系 . 





4 争 一 部 分 相关 知识 介绍 


1.2.2 数据 库 管理 系统 


DBMS (数据 库 管理 系统 ) ”一 个 能 够 让 用 户 定义 、 创 建 和 维护 数据 库 以 及 并 控制 对 数 





据 库 的 访问 的 软件 系统 。 


DBMS 是 与 用 户 、 应 用 程序 和 数据 库 进行 相互 作用 的 软件 。 其 中 ，DBMS 人 允许 用 户 从 数据 
库 中 插入 、 更 新 、 删 除 和 检索 数据 。 拥 有 所 有 数据 和 数据 描述 的 核心 仓库 使 得 DBMS 能 够 提 
供 对 数据 进行 通常 查询 功能 的 语言 ， 称 为 查询 语言 。 这 种 查询 语言 的 提供 (例如 SQL)， 降 低 
了 早期 系统 中 所 存在 的 问题 ， 那 时 ， 用 户 不 得 不 使 用 固定 的 一 组 查询 ， 或 者 用 额外 的 程序 来 
解决 主要 的 软件 管理 问题 。 我 们 将 在 下 一 节 讨 论 DBMS 的 这 些 典型 功能 和 服务 。 


结构 化 查询 语言 (Structured Query Language, SQL， 发 音 为 S-Q-L 或 者 See-Quel) 关系 
数据 库 管 理 系 统 (例如 ，Microsoft Access、Microsoft SQL Server 和 Oracle) 的 主要 查询 
语言 。 

















1.2.3 数据 库 应 用 程序 








应 用 程序 (Application Program) ”一 个 通过 向 DBMS 发 出 合适 的 请 求 (一 般 是 一 个 
SQL 语 向 ) 与 数据 库 交 互 的 计算 机 应 用 程序 。 | 


用 户 通过 那些 用 于 创建 和 维护 数据 库 并 产生 信息 的 应 用 程序 与 数据 库 进行 交互 。 这 些 程 
序 可 以 是 传统 的 批 应 用 程序 ， 或 者 是 目前 更 常见 的 联机 应 用 程序 。 这 些 应 用 程序 可 以 用 一 些 
程序 设计 语言 编写 ， 也 可 以 在 一 些 更 高 级 的 第 四 代 语 言 中 编写 。 图 1-2 说 明了 数据 库 的 使 用 情 
形 ， 它 显示 了 Sales (销售 ) 部 门 和 Stock Control (库存 控制 ) 部 门 使 用 他 们 的 应 用 程序 通过 
DBMS 来 访问 数据 库 的 情况 ， 每 个 部 门 的 应 用 程序 处 理 他 们 的 数据 项 、 维 护 数据 并 产生 报告 。 
数据 的 物理 结构 和 存储 由 DBMS 来 管理 。 


二 










。 库存 控制 部 


图 1-2 销售 和 库存 控制 部 门 通过 应 用 程序 和 DBMS 访 问 数 据 库 的 情形 














图 1-1 说 明了 数据 库 的 访问 形式 。 它 表明 销售 和 库存 控制 部 门 使 用 他 们 的 应 用 程序 ， 通 过 
DBMS 对 数据 库 进 行 访问 。 每 个 部 门 的 应 用 程序 处 理 数 据 入 口 、 数 据 维护 和 生成 报表 。 数 据 
的 物理 结构 和 存储 由 DBMS 管 理 。 

1.2.4 视图 

根据 前 面 所 描述 的 功能 ，DBMS 是 非常 强大 的 工具 。 但 是 ， 最 终 用 户 对 系统 的 任务 是 复 
杂 还 是 简单 并 不 感 兴趣 ， 他 们 可 能 会 认为 DBMS 使 事情 变 得 更 复杂 了 ， 因 为 他 们 现在 可 能 看 
到 比 他 们 实际 所 需要 或 想 做 的 工作 更 多 的 数据 。 考 虑 到 这 个 问题 DBMS 提供 了 称 为 视图 的 
机 制 ， 该 机 制 允 许 每 个 用 户 在 数据 库 中 有 自己 定制 的 数据 库 视图 ， 这 些 视图 是 数据 库 的 子 集 。 


视图 (View) 一 个 “虚拟 的 表 ”， 它 不 实际 存在 在 数据 库 中 ， 但 它 由 DBMS 从 视图 


所 涉及 的 基本 表 中 产生 。 


视图 通常 被 定义 成 在 基本 表 上 进行 操作 的 查询 所 产生 虚拟 表 ， 除 了 可 以 让 用 户 以 他 们 希 
望 的 方式 看 到 数据 来 降低 复杂 度 外 ， 视 图 还 有 其 他 几 个 优点 : 

* 视图 提供 了 一 个 安全 级 别 。 视 图 可 以 不 包含 那些 用 户 不 能 看 到 的 数据 。 例 如 ， 我 们 可 以 
创建 一 个 允许 分 公司 负责 人 和 财务 部 门 看 的 有 关 所 有 职工 的 数据 的 视图 ， 这 个 视图 中 包 
括 工资 的 详细 信息 。 而 且 , 我 们 可 以 创建 另 一 个 视图 ， 在 这 个 视图 中 不 包括 工资 的 详细 
信息 ， 可 由 其 他 职工 使 用 。 

"视图 提供 了 数据 库 的 定制 的 显示 机 制 。 例 如 ， 库 存 控制 部 门 (Stock Control Department) 
可 能 希望 把 录像 的 日 租金 率 (Daily Rental Rate) 称 为 日 租金 (Daily Rental)。 

* 祝 图 能 提供 一 致 的 、 稳 定 的 数据 库 结构 图 ， 其 至 当 数 据 库 发 生 了 变化 时 也 是 这 样 ( 例 如 ， 
增加 或 删除 列 ， 关 系 改变 了 ， 数 据 文件 分 离 了 ， 数 据 库 被 重 构 了 或 者 重新 命名 了 )。 如 
果 从 数据 文件 中 添加 或 删除 了 列 ， 而 且 这 些 列 与 视图 没有 关系 ， 则 视图 不 会 受 这 些 变化 
的 影响 。 因 此 ， 视 图 提供 了 数据 库 所 提供 的 另 一 种 数据 独立 性 ， 我 们 在 1.2.1 节 中 曾 描述 
过 数据 独立 性 。 


1.2.5 DBMS 环 境 的 组 成 


DBMS 环 境 有 五 个 主要 组 成 部 分 : 硬件 、 软 件 、 数 据 、 过 程 和 人 。 

1) 硬件 DBMS 和 应 用 程序 运行 的 计算 机 系统 。 这 可 以 从 单 台 PC 机 ， 到 单 台大 型 机 ， 再 
到 计算 机 网 络 。 

2) 软件 DBMS 软 件 和 应 用 程序 以 及 操作 系统 ， 如 果 将 DBMS 用 在 网 络 上 ， 那 么 还 包括 网 络 
软件 。 

3) 数据 ”数据 扮演 了 硬件 、 软 件 以 及 人 之 间 的 桥梁 。 正如 我 们 已 经 说 过 的 ， 数 据 库 包 含 
了 运行 数据 和 元 数据 (关于 数据 的 数据 )。 

4) 过 程 ”控制 数据 库 设 计 和 使 用 的 指令 和 规则 。 这 包括 如 何 登 录 到 DBMS 的 指令 集 ， 制 作 
数据 库 备 份 以 及 如 何 处 理 软 硬 件 错误 。 

5) 人 包括 数据 库 设计 者 、 数 据 库 管理 员 (DBA)、 应 用 程序 员 和 最 终 用 户 。 


1.2.6 DBMS 架 构 





在 Web 出 现 之 前 ，DBMS 通 常 被 分 为 两 部 分 : 
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。 用 来 处 理 主要 业务 、 数 据 处 理 逻 辑 以 及 与 用 户 交 互 的 接口 的 客户 端 程序 。 

。 管 理 和 控制 对 数据 库 的 访问 的 服务 器 端 程序 (有 时 称 为 DBMS 引 擎 ) 。 

这 就 是 所 谓 的 两 层 客户 - 服务 器 架构 。 图 1-3 所 示 的 为 一 个 办 公 地 点 遍布 美国 的 录像 出 租 
公司 StayHome 的 简化 的 客户 - 服务 器 架构 。 它 显示 了 位 于 西雅图 的 公司 总 部 的 中 央 数 据 库 和 
服务 器 ， 以 及 一 些 位 于 美国 各 地 的 分 公司 的 客户 端 。 

在 20 世 纪 90 年 代 中 期 ， 应 用 程序 变 得 更 加 复杂 ， 并 可 能 会 为 成 百 上 千 的 最 终 用 户 服务 ， 
”这 种 架构 的 客户 端 产生 了 两 个 问题 : 

*“ 腾 ”客户 端 ， 为 使 运行 有 效 ， 需要 大 量 客户 端 计算 机 上 的 资源 (包括 磁盘 空间 、 

RAM 和 CPU 的 功率 )。 

。 相 当 可 观 的 客户 端 管 理 的 开销 。 

到 1995 年 ， 出 现 了 一 种 新 的 传统 的 两 层 客户 -服务 器 模型 的 改良 版 本 ， 它 解决 了 这 些 问 
题 ， 这 就 是 所 谓 的 三 层 客 户 - 服务 器 架构 。 这 种 新 的 架构 提出 了 三 个 层次 ， 每 层 运行 于 不 同 
的 平台 上 : 

_D 用 户 接口 层 ”运行 在 最 终 用 户 的 计算 机 (客户 端 ) 上 。 

2) 业务 逻辑 和 数据 处 理 层 ”这 个 中 间 层 运行 在 服务 器 上 ， 并 且 经 常 被 称 为 应 用 程序 服务 
器 。 应 用 程序 服务 器 是 用 于 为 多 个 客户 端 提供 服务 的 。 

3) DBMS 存储 中 间 层 所 需要 的 数据 。 该 层 可 以 运行 在 被 称 为 数据 库 服务 器 的 独立 的 服 
务 器 上 。 

这 种 三 层 设计 与 传统 的 两 层 设 计 相 比 有 许多 优点 ， 比 如 : 

。“ 瘦 ”客户 端 ， 需要 的 硬件 代价 较 小 。 

* 将 许多 最 终 用 户 的 业务 逻辑 集中 在 单一 的 应 用 程序 服务 器 上 ， 从 而 简化 了 应 用 程序 的 维 

护 。 这 消除 了 传统 两 层 客户 - 服务 器 模型 软件 分 布 的 问题 。 

“ 增加 了 模块 性 ， 更 容易 修改 和 替换 某 一 层 ， 而 不 影响 其 他 层 。 

* 把 核心 业务 逻辑 从 数据 库 功 能 中 分 离 出 来 ， 从 而 使 负载 更 容易 平衡 。 例 如 ， 一 个 事务 处 
理 监视 器 〈Transaction Processing Monitor， TPM) 可 以 用 来 减少 连接 数据 库 服 务 器 的 
次 数 (TPM 是 为 了 给 联机 事务 处 理 (OLTP) 提供 稳定 环境 而 控制 客户 和 服务 器 间 数 据 
传输 的 程序 ) 。 

还 有 一 个 优点 是 三 层 架 构 非 常 自然 地 适合 web 环境 ， 将 Web 浏 览 器 作为 “ 瘦 ” 客 户 端 ， 

Web 服 务 器 作为 应 用 程序 服务 器 。 三 层 客户 -服务 器 架构 如 图 1.4 所 示 。 


1.3 DBMS 的 功能 


本 节 简 单 看 一 下 当前 我 们 所 期 望 的 全 面 的 DBMS 提 供 的 功能 和 服务 。 

1. 数据 存储 、 检 索 和 更 新 

这 是 DBMS 的 基础 功能 。 从 我 们 前 面 的 讨论 中 ， 很 清楚 要 提供 这 种 功能 、DBMS 要 对 用 户 
隐藏 内 部 的 物理 实现 细节 (例如 文件 组 织 方式 和 存储 结构 ) 。 

2. 用 户 可 访问 的 目录 

DBMS 的 一 个 关键 特征 是 提供 了 完整 的 系统 目录 来 保存 与 数据 库 结构 、 用 户 、 应 用 程序 
等 有 关 的 数据 。 该 目录 对 用 户 和 DBMS 来 说 都 是 可 以 获得 的 。 信息 的 数量 和 使 用 信息 的 方式 
随 着 DBMS 的 不 同 而 不 同 。 通 常情 况 下 ， 系 统 目录 存储 以 下 内 容 。 
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。 数据 项 的 名 称 、 类 型 和 大 小 。 
"数据 的 完整 性 约束 。 

“。 有 权 访 问 该 数据 的 用 户 名 称 。 
3. 事务 支持 


| 村 (Transaction) ”由 用 户 或 应 用 程序 执行 的 一 个 动作 或 一 系列 动作 ， 这 些 动作 访问 | 








或 修改 数据 库 的 内 容 。 


例如 ，StayHome 的 简单 事务 可 能 是 在 数据 库 中 增加 新 员工 、 修 改 某 些 员工 的 工资 或 着 从 
登记 夭 中 删除 一 个 成 员 。 更 复杂 一 些 的 例子 可 能 是 从 数据 库 中 删除 负责 人 ， 并 且 重 新 任命 一 
名 成 员 作为 负责 人 。 在 这 种 情况 下 ， 对 数据 库 进 行 的 更 改 就 不 止 一 次 。 如 果 事 务 在 执行 期 间 
失败 了 ， 这 可 能 是 因为 计算 机 出 现 故 障 ， 这 时 数据 库 将 会 处 于 一 个 不 一 致 的 状态 : 已 经 完成 
了 一 些 更 改 ， 还 有 一 些 没有 完成 。 例 如 ， 分 公司 还 没有 分 配 一 个 新 的 负责 人 。 结 果 ， 已 经 完 
成 的 变化 不 得 不 撤销 ， 使 数据 库 再 次 回 到 一 致 状态 。 | 

为 了 克服 这 种 问题 DBMS 提供 了 一 种 机 制 用 来 确保 给 定 事务 内 的 所 有 操作 均 完 成 或 者 均 不 做 。 

4. 并 发 控制 服务 

使 用 DBMS 的 一 个 主要 目的 就 是 使 多 用 户 可 以 同时 访问 共享 数据 ， 这 称 为 并 发 控制 ， 如 
时 所 有 用 户 只 是 读数 据 ， 并 发 访问 相对 来 说 就 比较 容易 ， 因 为 他 们 相互 没有 影响 。 但 是 ， 当 
两 个 或 更 多 的 用 户 同时 访问 数据 库 ， 而 且 他 们 之 中 至 少 有 一 个 在 更 新 数据 ， 则 可 能 会 导致 数 
据 不 一 致 。 例 如 ， 有 两 个 事务 Ti 和 T: 同 时 执行 ， 如 图 1-5 所 示 ， 





读 (bal,) 


读 (bal,) bal, = bal, ~ 20 
bal =bal, + 5 写 (bal) 
写 (bal) 





图 1-5 丢失 更 新 问题 


T; 从 StayHome 成 员 的 金额 中 减 去 20 美 元 (当前 余额 bal, 为 50 美 元 )， 并 且 T, 为 相同 的 账户 
添加 了 5 美元 。 如 果 事务 是 顺序 执行 的 ， 没 有 交错 执行 无 论 哪个 事务 先 执行 ， 最 后 的 金额 都 
应 该 是 35 美 元 。 两 个 事务 几乎 是 同时 开始 的 ， 同 时 读 到 bal, 为 50 美 元。T, 将 bal, 碱 去 20 美 元 得 
到 30 美 元 并 且 存 于 数据 库 中 。 同 时 ， 事 务 T, 将 bal. 增 加 5 美元 为 55 美 元 ， 并 且 将 该 值 也 存 寺 数 
据 库 中 ， 这 样 就 覆盖 了 前 面 的 更 新 ， 也 就 “丢失 ”了 20 美 元 。 

当 多 用 户 访问 数据 库 时 ，DBMS 必 须 确保 不 会 发 生 类 似 的 冲突 。 

5. 恢复 服务 

当 讨论 事务 支持 时 ， 我 们 注意 到 如 果 事务 失败 ， 数 据 库 必 须要 返回 到 一 个 _ 致 性 状态 
这 就 是 所 谓 的 恢复 控制 。 它 的 产生 可 能 是 因为 系统 崩溃 、 介 质 失败 和 导致 DBMS 停 目的 硬 坎 
件 错误 ， 也 可 能 是 因为 事务 运行 期 间 用 户 发 现 了 错误 ， 所 以 在 完成 前 异常 终止 了 该 事务 ， 无 
论 是 何 种 情况 ，DBMS 都 必须 提供 将 数据 库 恢复 到 正确 的 一 致 性状 态 的 机 制 . 

6. 授权 服务 

不 难 发 现 这 样 的 情况 ， 我 们 并 不 希望 数据 库 中 的 数据 对 所 有 用 户 都 是 可 见 的。 例如 ， 我 
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们 可 能 只 希望 分 公司 负责 人 和 财务 部 门 的 人 员 可 以 看 到 员工 相关 的 工资 信息 ， 而 不 允许 所 有 
其 他 用 户 看 见 这 些 数据 。 此 外 ， 我 们 可 能 希望 不 允许 未 授权 的 用 户 访问 数据 库 。 术 语 “ 安 全 
性 ”(Security ) 就 是 防止 数据 库 被 非法 访问 ， 包 括 有 意 的 和 偶然 的 。 我 们 希望 DBMS 提 供 确 
保 数 据 安全 的 机 制 。 

7. 对 数据 通信 的 支持 

绝 大 多 数 用 户 从 终端 访问 数据 库 。 有 时 ， 这 些 终端 直接 连接 到 装 有 DBMS 的 主机 上 。 而 
其他 情况 下 ， 终 端 在 匠 远 的 地 方 ， 与 装 有 DBMS 的 主机 通过 网 络 关系 。 无 论 哪 种 情况 ，DBMS 
都 必须 能 结合 网 络 通信 软件 。 其 至 面向 PC 机 的 DBMS 也 应 该 能 在 局 域 网 (LAN) 上 运行 ， 这 
样 才能 为 用 户 创建 一 个 共享 的 核心 数据 库 ， 而 不 是 一 系列 不 同 的 数据 库 。 

8. 完整 性 服务 

数据 库 完整 性 (Database Integrity) 指 的 是 存储 数据 的 正确 性 和 一 致 性 。 这 可 以 看 成 是 另 
一 种 类 型 的 数据 库 保护 。 尽 管 它 与 安全 性 相关 ， 但 性 有 更 广 的 内 涵 。 完 整 性 关心 的 是 数据 本 
身 的 质量 。 完 整 性 通常 用 术语 “约束 ”( Constraint) 来 表达 ， 约束 是 数据 库 中 不 可 违反 的 一 
致 性 原则 。 例 如 ， 我 们 可 能 希望 说 明 这 样 的 约束 ，StayHome 中 的 成 员 都 不 能 同时 租借 超过 10 
盘 的 录像 。 这 时 ， 我 们 希望 当 租借 一 盘 录 像 给 一 个 成 员 时 ，DBMS 会 检查 是 否 超过 了 这 个 限 
制 ， 并 在 达到 界限 时 防止 再 次 借 出 。 

9. 加 强 数据 独立 性 的 服务 

正如 我 们 在 1.2.4 节 中 讨论 的 ， 数 据 独立 性 通常 是 通过 视图 机 制 获得 的 。 通 常 有 几 种 类 型 
的 数据 库 物 理 特性 的 变化 不 会 影响 视图 ， 例 如 使 用 不 同 的 文件 组 织 方式 或 者 修改 索引 。 这 称 
为 物理 数据 独立 性 。 但 是 ， 完 全 的 逻辑 数据 独立 性 更 难 实现 。 增 加 新 表 或 者 新 列 通 常 是 可 以 
的 ， 但 删除 它们 就 不 行 。 在 有 些 系 统 中 ， 对 已 经 存在 的 表 的 任何 类 型 的 改变 都 是 禁止 的 。 

10. 实用 工具 服务 

实用 工具 程序 帮助 DBA 有 效 地 管理 数据 库 。 实 用 工具 的 例子 有 : 

* 导入 工具 ， 将 数据 从 平面 文件 导入 到 数据 库 中 ; 导出 工具 ， 将 数据 库 中 的 数据 导出 到 平 

面 文件 中 。 

* 监视 工具 ， 监 视 数据 库 的 使 用 和 操作 。 





上 面 的 讨论 是 基于 通常 情况 进行 的 。DBMS 提 供 的 实际 功能 的 等 级 随 产品 的 不 同 而 
不 同 。 例如 ,面向 PC 的 DBMS 可 能 不 支持 并 发 共享 访问 ， 它 可 能 只 提供 了 有 限 的 安全 性 、 
完整 性 和 恢复 控制 。 但 是 ， 现代 大 型 的 多 用 户 PBMS 产 品 都 提供 了 以 上 所 有 的 功能 ， 其 
至 严 多 。 现 代 系 统 是 极端 复杂 的 ， 它 由 几 百 万 行 代码 组 成 的 软件 代码 段 以 及 大 量 的 文档 
组 成 。 








前 面 的 讨论 被 有 意 简化 了 ， 但 是 对 DBMS 功 能 的 概要 介绍 已 经 足够 了 。 有 兴趣 的 读者 可 
以 参考 ConnoHy 和 Begg (2002 ) 。 


1.4 数据 库 设计 


到 现在 为 止 ， 我 们 认为 数据 库 中 存在 数据 的 结构 是 理所当然 的 。 但 我 们 如 何 获得 这 种 结 
构 ? 答案 很 简单 : 数据 库 结构 是 数据 库 设计 期 间 形 成 的 。 但 是 ， 进 行 数据 库 设计 是 极为 复杂 
的 。 构 造 一 个 满足 公司 信息 需求 的 系统 需要 一 个 数据 驱动 的 方法 ， 也 就 是 我 们 首先 想到 的 应 








该 是 数据 ， 然 后 才 是 应 用 程序 。 系 统 最 终 是 否 能 被 用 户 接受 ， 数 据 库 设计 是 至 关 重 要 的 。 一 
个 设计 不 良 的 数据 库 会 产生 很 多 错误 ， 这 些 错 误 可 能 导致 错误 的 决策 ， 这 对 公司 会 有 非常 严 
重 的 反映 。 另 一 方面 ， 设 计 良 好 的 数据 库 可 以 为 决策 制定 过 程 的 成 功 提供 正确 的 信息 。 

我 们 用 了 几 章 的 篇 幅 介绍 了 完整 的 数据 库 设 计 方 法 学 (参见 第 9 章 ~ 第 16 章 )。 我 们 将 这 
个 方法 学 分 解 为 一 系列 简单 的 步骤 ， 并 提供 了 全 部 的 概要 提示 。 在 这 些 章 中 ， 我 们 使 用 了 一 
个 叫做 StayHome 的 基于 录像 出 租 公司 的 例子 。 为 了 帮助 强化 方法 学 ， 在 第 17 章 和 第 18 章 中 我 
们 用 了 另 一 个 案例 来 学 习 ， 这 是 个 叫做 Perfect Pets 的 宠物 诊所 。 此 外 ， 在 附录 E 中 ， 我 们 提供 
了 大 量 的 常见 的 业务 数据 模型 。 

遗憾 的 是 ， 数 据 库 设计 方法 学 并 不 是 非常 的 流行 ， 可 能 这 是 开发 数据 库 系统 失败 的 主要 原 
肉 。 由 于 数据 库 设计 中 缺乏 结构 化 的 方法 ， 数 据 库 工 程 所 必需 的 时 间 和 资源 通常 被 低估 了 ,在 
面 对 应 用 程序 的 需求 时 ， 所 开发 的 数据 库 并 不 充分 、 效 率 也 较 低 、 文 档 有 限 、 维 护 也 很 困难 。 

我 们 希望 本 书 中 提出 的 方法 学 将 帮助 改变 这 种 状态 。 


1.5 DBMS 的 优 缺 点 


你 阅读 本 书 可 能 说 明 你 已 经 知道 了 DBMS 的 许多 优点 ， 例 如 : 

* 控制 数据 元 余 。 数 据 库 方法 尽 可 能 地 消除 了 元 余 。 但 是 ， 并 没有 完全 消除 元 余 ， 而 是 控 
制 了 大 量 数据 库 固有 的 元 余 。 例 如 ， 为 了 表达 数据 间 的 关系 ， 键 数据 项 的 重复 一 般 是 必 
要 的 ， 有 时 为 了 提高 性 能 也 会 重复 一 些 数据 项 。 继 续 阅 读本 书 ， 你 就 会 明白 受 榨 重 复 的 
原因 。 

“ 数据 一 致 性 。 通 过 消除 或 控制 元 余 ， 我 们 降低 了 不 一 致 性 产生 的 危险 。 如 果 数 据 项 在 数据 
库 中 只 存储 了 一 次 ， 则 任何 对 该 值 的 更 新 均 只 需 进行 一 次 ， 而 且 新 的 值 立 即 就 可 以 被 所 有 
用 户 获 得 。 如 果 数 据 项 不 只 存储 了 一 次 ， 而 且 系统 意识 到 这 点 ， 系 统 将 可 以 确保 该 项 的 所 
有 拷贝 都 保持 一 致 。 但 是 ， 目 前 许多 DBMS 都 不 能 自动 确保 这 种 类 型 的 一 致 性 。 

“数据 共享 。 在 基于 文件 的 访问 方式 下 ， 数 据 通 常 只 被 使 用 部 门 或 人 员 拥 有 ， 而 数据 库 属 
于 整个 公司 ， 可 以 被 有 权限 的 用 户 共享 。 这 种 方式 使 更 多 的 用 户 共 享 了 更 多 的 数据 . 此 
外 ， 新 的 应 用 程序 可 以 依赖 于 数据 库 中 已 经 存在 的 数据 ， 并 且 只 增加 目前 没有 存储 的 数 
据 ， 而 不 用 重新 定义 所 有 的 数据 需求 。 新 的 应 用 程序 也 可 以 依赖 于 DBMS 提 供 的 功能 
(例如 数据 定义 和 操纵 ， 以 及 并 发 和 恢复 控制 )， 而 不 是 自己 提供 这 些 功能 ， 

* 增强 的 数据 完整 性 。 正 如 我 们 已 经 说 明 的 ， 数 据 库 完整 性 通常 是 通过 术语 “约束 ”来 表 
示 的 ， 它 是 数据 库 中 必须 遵循 的 一 致 性 规则 。 约 束 可 以 应 用 在 一 个 记录 的 数据 项 上 ， 也 
可 以 应 用 在 记录 之 间 的 关系 上 。 此 外 ， 数 据 集成 允许 我 们 定义 完整 性 约束 ， 并 由 DBMS 
来 保证 这 些 完整 性 约束 的 实现 。 

"通过 数据 独立 性 提高 了 数据 的 维护 。 既 然 DBMS 将 数据 描述 从 应 用 程序 中 分 离 出 来 ， 这 
使 应 用 程序 不 受 数据 描述 变化 的 影响 ， 这 就 是 数据 独立 性 ， 它 的 出 现 简化 了 数据 库 应 用 
程序 的 维护 。 

其 他 的 优点 包括 : 可 提高 安全 性 、 提 高 数据 可 访问 性 和 响应 性 能 、 提 高 效率 、 提 高 并 发 

性 以 及 提高 备份 和 恢复 服务 。 但 是 ， 数 据 库 方 法 也 有 一 些 缺点 : 

“复杂 性 。 正 如 我 们 前 面 所 提 到 的 ，DBMS 是 极端 复杂 的 软件 组 合 ， 所 有 用 户 (数据 座 设 
计 者 和 开发 者 ，DBA 以 及 最 终 用 户 ) 都 必须 理解 这 些 功能 以 便 能 充分 利用 它 。 

“DBMS 费 用 。DBMS 的 费用 随 所 提供 的 环境 和 功能 的 不 同 而 不 同 。 例 如 ， 一 个 PC 机 的 单 
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用 户 DBMS 可 能 只 需 100 美 元 。 但 是 ， 一 个 支持 成 百 用 户 的 大 型 机 的 多 用 户 DBMS 可 能 
是 极为 昂贵 的 ， 可 能 10 万 美元 到 100 万 美元 。 而 且 还 有 每 年 维护 所 用 的 周期 性 花费 ， 
般 为 所 列 价格 的 百 分 之 一 。 

* 转换 费用 。 在 某 些 情况 下 ，DBMS 和 其 他 硬件 上 的 费用 可 能 与 升级 已 经 存在 的 应 用 程序 ， 
使 它们 可 以 在 新 的 DBMS 和 硬件 上 运行 一 样 多 。 这 些 费用 也 包括 训练 员工 使 用 新 的 系统 和 
可 能 雇佣 专业 人 员 帮 助 升级 和 运行 系统 的 花费 。 这 些 费 用 是 一 些 公司 依赖 于 当前 的 系统 
而 不 能 转向 更 现代 数据 库 系 统 的 一 个 主要 原因 。 术 语 “ 遗 留 系 统 ”(legacy system) 有 时 
就 用 来 指 那些 比较 旧 的 ， 而 且 通 常 比较 差 的 系统 (例如 基于 文件 的 、 层 次 或 网 络 系统 )。 

“ 性能。 通常， 基于 文件 的 系统 是 为 特定 应 用 设计 的 ， 例 如 货物 计价 。 其 结果 是 ， 性 能 通 
常 很 好 。 但 是 ，DBMS 是 为 更 泛 化 并 迎合 许多 应 用 而 不 是 一 个 而 编写 的 。 这 可 能 就 会 产 
生 某 些 应 用 不 再 那么 快 了 的 结果 。 

“更 高 的 故障 影响 。 资 源 高 度 集中 使 系统 更 脆弱 。 由 于 所 有 用 户 和 应 用 都 依赖 于 DBMS 的 
可 用 性 ， 所 以 任何 组 件 的 故障 都 会 给 操作 带 来 完全 的 停止 直到 故障 被 修复 。 


1.6 本 章 小 结 


“数据 库 是 逻辑 上 相关 的 可 共享 的 数据 (以 及 数据 的 描述 ) 集合 ， 用 于 处 理 公 司 所 需 的 信 
息 。DBMS 是 用 户 可 以 定义 、 创建 和 维护 数据 库 以 及 提供 对 该 数据 库 访问 进行 控制 的 软 
件 系统 。 一 个 应 用 程序 是 一 个 计算 机 程序 ， 它 通过 向 DBMS 发 出 合适 的 请 求 (通常 
SQL 语 向 ) 来 与 数据 库 交 互 。 更 广泛 地 说 ， 数 据 库 系 统 是 用 于 定 久 数据库、DBMS 和 
数据 库 本 身 交 互 的 应 用 程序 的 集合 。 

。 所 有 对 数据 库 的 访问 都 要 通过 DBMS。DBMS 提 供 了 多 许 用 户 定义 数据 库 ， 从 数据 库 中 
插入 、 更 新 、 删 除 和 检索 数据 的 功能 。 

“构成 DBMS 环 境 的 主要 五 个 方面 是 : 硬件 (计算 机 )、 软 件 (DBMS、 操 作 系 统 和 应 用 
程序 )、 数 据 、 过 程 和 人 。 人 包括 数据 库 管 理 员 (DBA)、 数 据 库 设 计 者 、 应 用 程序 员 和 
最 终 用 户 。 

“在 Web 环 境 中 ， 传 统 的 两 层 客户 -服务 器 模型 已 经 被 三 层 模型 替代 ， 三 层 模型 由 用 户 界 
面 层 (客户 )、 业 务 逻 辑 和 数据 处 理 层 (应 用 服务 器 ) 构成 ， 并 且 DBMS (数据 库 服务 
器 ) 分 布 在 不 同 的 机 器 上 。 

“DBMS 提 供 对 数据 库 的 受 控 访问 。 它 提供 安全 性 、 完 整 性 、 并 发 和 人 恢复 控制 以 及 用 户 可 
访问 的 目录 ， 它 也 提供 视图 机 制 来 简化 用 户 要 处 理 的 数据 。 

“ 数据库 访问 方式 的 优点 包括 控制 数据 元 余 、 数 据 一 致 性 、 数 据 共享 以 及 增强 安全 性 和 完 
整 性 。 缺 点 包括 复杂 性 、 费 用 高 、 降 低 了 性 能 和 更 高 的 故障 影响 。 


复习 题 


1.1 除了 本 书 1.1 节 列 出 的 数据 库 系统 外 ， 再 列 出 四 个 数据 库 系 统 的 例子 。 
1.2 讨论 下 述 术 语 的 含义 : 

(a) 数据 

(b) 数据 库 

(c) 数据 库 管理 系统 








(d) 应 用 程序 

(e) 数据 独立 性 

(f) 视图 

描述 一 下 数据 库 应 用 的 主要 特征 。 

描述 DBMS 环 境 的 五 个 组 成 部 分 ， 并 讨论 它们 彼此 之 间 的 关系 。 

描述 传统 的 两 层 客户 -服务 器 架构 的 问题 ， 并 讨论 在 三 层 客户 -服务 器 架构 中 是 如 何 
克服 这 些 问 题 的 。 

描述 现代 的 功能 全 面 的 多 用 户 PBMS 应 该 提供 哪些 功能 。 

对 你 在 问题 6 中 提出 的 功能 ， 你 认为 哪个 功能 在 个 人 PC DBMS 中 是 不 必要 的 ? 给 出 
合适 的 理由 。 

讨论 DBMS 的 优点 和 缺点 。 





第 2 章 关系 模型 


本 章 主题 : 

。 什 么 是 数据 模型 以 及 它 的 用 途 。 

。 关 系 模型 的 术语 。 

。 怎样 使 用 表 来 描述 数据 。 

。 数 据 库 关系 的 属性 。 

。 如 何 标识 候选 键 、 主 键 、 备 用 键 和 外 键 。 

。 实 体 完 整 性 和 参照 完整 性 的 含义 。 

“关于 SQL 和 QBE， 两 种 使 用 最 广泛 的 关系 语言 。 

关系 数据 库 管理 系统 (Relational Database Management System, RDBMS ) 已 经 成 为 主流 
的 数据 处 理 软 件 ， 估 计 每 年 出 售 的 总 值 大 约 为 150 亿 ~200 亿 美元 (还 包括 500 亿 的 工具 出 售 )， 
并 且 每 年 以 大 约 25% 的 速率 在 增长 。RDBMS 代 表 了 第 二 代 DBMS ， 它 基于 E.F.Codd 博 士 1970 
年 的 “A Relational Model of Data for Large Shared Data Banks”( 大 型 共享 数据 银行 的 关系 数 
据 模型 ) 论文 中 所 提出 的 关系 数据 模型 。 在 这 种 关系 模型 中 ， 所 有 数据 都 被 逻辑 地 组 织 到 关 
系 〈 表 ) 中 。 关 系 模型 的 一 个 强大 优势 就 是 这 种 简单 的 逻辑 结构 。 然 而 ， 在 这 种 简单 的 逻辑 
结构 背后 ， 是 合理 的 理论 基础 ， 而 这 正 是 第 一 代 DBMS (网 络 和 层次 DBMS ) 所 缺乏 的 。 

本 书 提出 的 设计 方法 学 是 基于 关系 数据 模型 的 ， 因 为 这 种 模型 是 你 最 可 能 使 用 的 。 在 本 
章 中 ， 我 们 讨论 关系 数据 模型 的 基本 概念 。 让 我 们 首先 看 一 下 什么 是 数据 模型 。 


2.1 数据 模型 


数据 模型 (Data Model) ”描述 数据 、 数 据 间 的 关系 以 及 公司 所 使 用 的 数据 的 约束 的 概 


念 集合 。 





模型 是 “现实 世界 ”对 象 、 事 件 和 他 们 之 间 的 关系 的 描述 。 它 主要 体现 公司 本 质 和 内 在 
的 东西 ， 而 忽视 偶然 因素 。 数 据 模型 尽力 去 描述 要 建 模 的 公司 或 者 公司 的 一 部 分 。 它 应 该 为 
数据 库 设 计 者 和 最 终 用 户 提供 基本 概念 和 符号 ， 使 他 们 明确 而 准确 地 交流 对 公司 数据 的 理解 。 
数据 模型 可 以 认为 由 如 下 三 部 分 组 成 : 

1) 结构 部 分 ， 由 定义 如 何 构造 数据 库 的 一 组 规则 组 成 。 

2) 操作 部 分 ， 定 义 允 许 在 数据 上 进行 的 操作 类 型 (包括 更 新 和 检索 数据 的 操作 和 改变 数 
据 库 结 构 的 操作 )。 

3) 一 组 可 能 的 完整 性 规则 和 集合， 确保 数据 是 正确 的 。 

数据 模型 的 目的 是 描述 数据 并 且 使 数据 可 以 理解 。 如 果 能 够 做 到 这 点 ， 那 么 设计 数据 库 
会 变 得 容易 得 多 。 在 本 章 剩 下 的 部 分 ， 我 们 研究 这 样 的 数据 模型 : 关系 数据 模型 。 


2.2 术语 


关系 模型 基于 关系 这 一 数学 概念 ， 而 关系 在 物理 上 对 应 为 表 。Codd 作 为 专业 数学 家 ， 
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使 用 数学 中 的 术语 创建 了 主要 的 理论 和 谓词 逻辑 。 在 本 节 中 ， 我 们 解释 关系 模型 中 的 术语 
和 结构 概念 。 在 2.3 节 中 ， 我 们 将 讨论 模型 的 完整 性 规则 ， 在 2.4 节 中 ， 我 们 解释 模型 的 操 
作 部 分 。 


2.2.1 关系 数据 结构 





| 关系 (Relation) 具有 列 和 行 的 表 。 | 


关系 DBMS 只 需要 用 户 将 数据 库 看 成 是 表 。 


注意 ” 这 种 认识 只 是 应 用 于 我 们 看 数据 库 的 方式 ， 并 不 应 用 于 数据 库 在 磁盘 上 的 物理 
结构 ， 我 们 可 以 应 用 不 同 的 物理 存储 结构 (例如 堆 文 件 和 哈 希 文件 )。 


属性 ( Attribute) ”关系 中 被 命名 的 列 。 


在 关系 模型 中 ， 我 们 用 关系 来 表示 我 们 要 在 数据 库 中 表达 的 对 象 的 信息 。 我 们 把 关系 描 
述 为 表 ， 表 中 的 行 对 应 不 同 的 记录 ， 表 中 的 列 对 应 不 同 的 属性 。 属 性 可 以 以 任何 顺序 出 现 ， 
而 关系 仍 保持 不 变 ， 因 此 表达 了 相同 的 含义 。 

例如 ， 在 StayHome 例 子 中 ， 分 公司 的 信息 由 Branch 关 系 描述 ， 有 属性 列 branchNo( 分 公司 
号 码 )、street、city、state、zipCode 和 mgrStaffNo( 对 应 于 分 公司 负责 人 的 员工 号 码 )。 相 似 的 
情况 是 ， 员 工 的 信息 由 Staff 关 系 所 描述 ， 包 括 属 性 列 staffNo (员工 号 码 )、name、position、 
salary 和 branchNo ( 员工 工作 的 分 公司 号 码 )。 图 2-1 为 Branch 和 Staff 关 系 的 例子 。 从 这 个 例子 
可 以 看 到 ， 列 包含 一 个 属性 的 值 ， 例 如 ，branchNo 列 只 包含 分 公司 号 码 。 




















域 (Domain) 一 个 或 多 个 属性 的 取 值 范围 。 
域 是 关系 模型 的 一 个 重要 特征 。 关 系数 据 库 中 每 个 属性 都 与 一 个 域 相关 。 每 个 属性 的 域 





都 可 能 不 同 ， 也 有 可 能 两 个 或 更 多 的 属性 有 相同 的 域 。 图 2-2 为 Branch 和 Staff 关 系 中 一 些 属性 
的 域 。 


注意 在 给 定 的 时 间 ， 域 中 可 能 会 有 目前 并 不 在 属性 中 出 现 的 值 。 换 向 话说 ， 域 描述 了 
属性 可 能 的 值 。 


域 的 概念 是 很 重要 的 ， 因 为 它 允 许 我 们 定义 属性 可 以 具有 的 值 的 意义 和 来 源 。 其 结果 是 ， 
系统 可 获得 更 多 的 信息 ， 并 且 可 以 拒绝 不 合理 的 操作 。 例 如 ， 比 较 员工 代码 和 公司 代码 对 我 们 
来 说 是 不 明智 的 ， 尽 管 在 域 定 义 中 ， 这 些 属性 都 是 字符 串 。 遗 憾 的 是 ， 现 在 很 多 RDBMS 并 不 支 
持 域 定义 。 


元 组 (Tuple) 关系 中 的 一 行 记录 。 


关系 的 元 素 是 表 中 的 元 组 或 记录 。 在 Staff 关 系 中 ， 每 个 记录 包含 五 个 值 ， 每 个 值 代表 一 
个 属性 。 因 为 有 属性 ， 元 组 可 以 以 任何 顺序 出 现 而 关系 并 没有 改变 ， 因 此 也 就 表达 了 相同 的 
意思 。 

最 后 ， 我 们 给 出 关系 数据 库 的 定义 : 


关系 数据 库 (Relational Database) ”规范 化 的 表 的 集合 。 











关系 数据 库 由 结构 正确 的 表 组 成 。 我 们 将 这 种 正确 性 称 为 规范 化 。 我 们 将 在 第 8 章 讨论 规 
学 化 问题 。 

选择 术语 

关系 模型 的 术语 非常 令 人 困惑 。 本 章 中 ， 我 们 介绍 两 组 术语 : “关系 、 属 性 和 元 组 ”和 
“ 表 、 列 和 记录 ”。 其 他 可 能 会 遇 到 的 术语 还 有 : 文件 (用 于 表 )、 行 (用 于 记录 ) 以 及 字段 
(用 于 列 )。 你 可 能 也 发 现 了 这 些 术 语 的 不 同 组 合 ， 例 如 表 、 行 和 字段 。 


从 现在 开始 ， 我 们 将 尽量 不 用 正式 的 术语 ， 如 关系 、 元 组 和 属性 ， 而 是 使 用 更 党 


用 的 术语 ， 如 表 、 记 录 和 列 。 





属性 ( 列 ) 






8 Jefferson Way 
City Center Plaza 
14— 8th Avenue 
16 - 14th Avenue 






元 组 
(记录 ) 





Branch 关 系 






图 2-1 Branch 和 Staff 关 系 的 例子 
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属 性 域 名 含义 

branchNo Branch_Numbers 设置 所 有 可 能 的 分 公司 办 字符 : 大 小 为 4, 范围 为 B001~B999 

street Street_Names 设置 所 有 可 能 的 街道 名 字符 : 大 小 为 60 

staffNo Staff Numbers 设 普 所 有 可 能 的 员工 号 字符 : 大 小 为 5, 范围 为 S000~S9999 

position Staff_Positions 设 雹 所 有 9 吕 能 的 员工 职位 Director、 Manager、Supervisor、Assistant、 
Buyer 中 2 一 - 

salary Staff_Salaries 设 贤 所 有 本 能 的 员工 薪水 值 货币 : 8 位 数 , 范围 为 $10000.00~$100000.00 











图 2-2 Branch 和 Staff 关 系 的 一 些 属性 的 域 


2.2.2 关系 表 的 属性 


关系 表 有 如 下 属性 : 

* 数据 库 中 每 个 表 都 有 区 别 于 其 他 表 的 名 称 。 

“ 表 中 的 每 个 单元 恰好 只 包含 一 个 值 (例如 ， 在 一 家 分 公司 的 一 个 单元 中 存储 几 个 电话 号 
码 是 不 对 的 。 换 名 话说 ， 表 不 能 包含 重复 的 组 。 满足 此 属性 的 关系 表 就 称 为 是 规范 化 的 
或 者 是 第 一 范式 的 )。 | 

* 每 个 列 有 不 同 的 名 字 。 

。 一 个 列 的 值 来 自 相 同 的 域 。 

“。 列 的 顺序 不 重要 。 换 名 话说 ， 给 定 列 名 ， 我 们 可 以 交换 整 列 。 

* 每 个 记录 都 是 不 同 的 ， 没 有 重复 记录 。 

“理论 上 说 ， 记 录 的 顺序 并 不 重要 (但 是 ， 实 际 上 ， 这 个 顺序 可 能 影响 访问 记录 的 效率 ， 
参见 第 13 章 ) 。 | 


2.2.3 关系 键 


正如 我 们 刚刚 提 到 的 ， 表 中 的 每 个 记录 都 必须 是 唯一 的 。 这 意味 着 我 们 需要 能 够 标识 的 
一 个 列 或 列 的 组 合 ( 称 为 关系 键 ) 来 提供 唯一 性 。 在 本 节 中 ， 我 们 解释 用 于 关系 键 的 术语 。 


超 键 (Superkey) ”一 个 列 或 者 列 集 ， 唯一 地 标识 了 表 中 的 一 个 记录 。 


由 于 超 键 可 能 包含 用 于 唯一 标识 列 所 不 必要 的 额外 的 列 ， 因 此 ， 我 们 对 仅 包含 能 够 唯 - 
标识 记录 的 最 小 数量 的 列 更 感 兴趣 。 


候选 键 (Candidate Key) 仅 包含 唯一 标识 实体 所 必需 的 最 小 数量 的 属性 / 列 的 超 链 。 


表 的 候选 键 有 两 个 属性 : 

* 唯一 性 : 在 每 条 记录 中 ， 候 选 键 的 值 唯一 标识 该 记录 。 

“最 小 性 : 没有 具有 唯一 性 属性 的 候选 键 的 子 集 。 

考虑 如 图 2-1 所 示 的 Branch 表 。 对 于 给 定 的 城市 的 值 ， 我 们 可 以 确定 几 个 分 公司 (例如 ， 
凸 雅 图 有 两 个 分 公司 )。 因 此 这 个 列 不 能 被 作为 候选 键 。 另 一 方面 ， 因 为 StayHome 为 每 个 分 
公司 分 配 了 一 个 唯一 的 分 公司 代码 ， 那 么 对 给 定 的 分 公司 的 代码 值 ，branchNo， 我 们 最 多 可 
以 确定 一 条 记录 ， 因 此 branchNo 是 候选 键 。 类 似 的 情况 是 ， 由 于 没有 任何 两 家 分 公司 有 相同 
的 邮政 编码 ， 所 以 ZipCode( 邮 政 编码 ) 也 可 以 作为 Branch 表 的 候选 键 ， 
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在 一 个 表 中 也 可 能 有 儿 个 候选 键 。 例 如 ， 考 虑 叫做 Role 的 表 ， 它 描述 了 演员 在 录像 中 所 
扮演 的 角色 。 这 张 表 由 演员 号 码 (actorNo )、 目 录 号 码 (catalogNo) 和 剧 中 的 角色 名 
(character) 组 成 ， 如 图 2-3 所 示 。 对 给 定 的 演员 号 码 actorNo 来 说 ， 该 演员 可 能 在 几 个 不 同 的 
录像 中 参加 演出 。 同 样 地 ， 对 于 给 定 的 目录 号 码 catalogNo 来 说 ， 可 能 有 几 个 不 同 的 演员 参加 
了 该 录像 的 演出 。 因 此 ，actorNo 和 catalogNo 本 身 都 不 能 作为 候选 键 。 但 actorNo 和 catalogNe 
的 组 合 ， 一 次 最 多 只 能 标识 一 条 记录 。 当 键 由 多 于 一 个 的 列 组 成 时 ， 我 们 称 之 为 候选 键 。 
提示 注意 不 要 看 到 了 例子 的 数据 就 推演 出 候选 键 ， 除 非 你 确定 例子 可 以 代表 将 要 存 于 
表 中 的 数据 。 通常 ， 表 的 一 个 示例 不 能 证 明 一 列 或 者 一 些 列 是 候选 键 。 在 某 一 特殊 时 刻 
没有 出 现 相同 的 值 的 事实 并 不 能 保证 不 存在 相同 值 的 可 能 性 。 但 是 ， 一 个 示例 中 相同 值 
的 出 现 可 以 说 明 某 些 列 不 能 联合 起 来 作 候 选 键 。 标 识 候选 键 需要 我 们 知道 该 列 在 现实 世 
界 中 所 代表 的 意义 ， 以 此 来 判断 是 否 可 能 存在 重复 值 。 只 有 依靠 这 些 语义 信息 ， 我 们 才 
能 确定 候选 键 。 
例如 ， 从 图 2-1 的 数据 中 ,我 们 可 能 认为 Staff 表 合适 的 候选 键 是 name,， 雇员 的 名 字 。 
因为 在 这 张 表 中 ， 只 有 一 个 Tom Daniels 出 现 ， 但 是 如 果 有 相同 名 字 的 成 员 加 入 了 公司 ， 
则 将 name 作 为 候选 键 就 不 对 了 。 








Role 

actorNo catalogNo | character 1 
A1002 207132 | James Bond | 
A3006 330553 | Frodo Baggins : 
AB401 902355 | Harry Potter | 
A2019 634817 | Captain Steve Hiller | 
A2019 445624 Agent} | 
A7525 445624 | Agent K | 
| A4343 781132 | Shrek | 








图 2-3 Role 表 的 一 个 例子 


主键 (Primary Key) ”唯一 标识 表 中 记录 的 候选 键 。 


由 于 一 张 表 中 没有 重复 记录 ， 因 此 总 是 有 可 能 唯一 地 标识 每 条 记录 。 这 意味 着 每 张 表 总 
会 有 一 个 主键 。 最 精 的 情况 是 ， 将 表 中 所 有 的 列 组 合 起 来 作为 主键 ， 但 通常 更 小 的 子 集 就 完 
全 可 以 区 分 记录 了。 没有 选 作 主 键 的 候选 键 称 为 备用 键 (alternate key)。 对 于 Branch 表 ， 如 
果 我 们 选择 branchNo 作 为 主键 ， 则 zipCode 就 是 备用 键 。 在 Role 表 中 ， 只 有 一 个 候选 键 ， 
actorNo 和 catalogNo 的 组 合 ， 所 以 这 两 列 自然 就 是 该 表 的 主键 。 


外 键 (Foreign Key) 一 个 表 中 的 一 个 列 或 多 个 列 的 集合 ， 这 些 列 匹 配 某 些 其 他 (也 可 


能 是 同一 个 ) 表 中 的 候选 键 。 


当 一 列 不 只 出 现在 一 张 表 中 的 时 候 ， 它 的 出 现 通常 代表 两 张 表 的 记录 之 间 的 关系 。 例 如 ， 
在 图 2-1 中 ，branchNo 在 Branch 和 Staff 表 中 都 存在 ， 这 是 非常 有 意义 的 ， 因 为 它 把 分 公司 和 在 
那里 工作 的 员工 联系 起 来 。 在 Branch 表 中 ， branchNo 是 主键 ， 但 在 Staff 表 中 ，branchNo 是 外 
键 。 我 们 说 Staff 表 中 的 branchNo 列 映射 或 引用 了 主 表 Branch 的 主键 列 branchNo。 在 这 种 情况 
下 ，Staff 被 称 为 子 表 ， 而 Branch 表 被 称 为 父 表 。 
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你 可 以 回顾 我 们 在 第 1 章 中 介绍 的 DBMS 的 一 个 优点 是 对 数据 宛 余 的 控制 。 控 制 宛 


余 的 一 个 例子 就 是 一 一 在 构建 关系 时 ， 这 些 普通 的 列 在 表达 关系 时 起 着 非常 重要 的 作 
用 ,正如 我 们 将 在 后 续 章 中 看 到 的 。 





2.2.4 关系 数据 库 的 表示 


关系 数据 库 由 一 个 或 多 个 表 组 成 。 描 述 关 系数 据 库 通常 的 惯例 是 给 定 每 张 表 的 名 称 ， 表 名 
后 面 跟着 列 名 ， 列 名 括 在 圆 括号 中 。 通 常 ， 主 键 用 下 划 线 表示 。StayHome 公 司 的 关系 数据 库 的 
描述 是 : 


Branch (branchNo,street, city, state, zipCode, mgrStaffNo) 

Staff (staffNo, name, position, salary, branchNo) 

Video (catalogNo, title, category, dailyRental, price, directorNo) 
Director (directorNo. directorName) 

Actor (actorNo, actorName) 

Role (actorNo, catalogNo, character) 

Member (memberNo, fName, IName， address) 

Registration (branchNo, memberNo, staffNo, dateJoined) 
RentalAgreement (rentalNo. dateOut, dateReturn, memberNo, videoNo) 
VideoForRent (YideoNo, available, catalogNo, branchNo) 


图 2-4 显 示 了 StayHome 数 据 库 的 例子 。 





图 2-4 StayHome 录 像 出 租 数 据 库 的 示例 
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Ga 207132 James Bond 
lee Tamahorni Pierce Brosnan 330553 Frodo Baggins 


Chris Columbus Elijah Wood Kk 902355 Harry Potter 


Peter Jackson Will Smith 634817 Captain Steve Hiller 
Andrew Adamson + S Tommy Lee Jones 445624 Agent 
Barry Sonnenfeld 343 $25 445624# Agent K 





Roland Emmerick - 781132 Shrek 





S7 - 11th Avenue, Seattle, WA 98105 

89 Redmond Rd, Portiand, OR 97117 
22 W. Capital Way, Portiand, OR 97201 
123 Suffolk Lane, Seattie, WA 98117 









M115656 
M115656 






2.3 关系 完整 性 


前 面 ， 我 们 讨论 了 关系 数据 模型 的 结构 部 分 。 正 如 我 们 在 2.1 节 中 所 提 到 的 ， 数 据 模型 还 
有 其 他 两 部 分 : 操作 部 分 (定义 允许 对 数据 进行 的 操作 ) 和 一 组 完整 性 规则 (确保 数据 的 正 
确 性 )。 本 节 我 们 讨论 关系 完整 性 规则 ， 下 一 节 中 我 们 讨论 主要 的 关系 操作 语言 。 

既然 每 个 列 都 有 相关 的 域 ， 那 么 就 有 限制 列 的 取 值 集合 的 约束 ( 称 为 域 约束 )。 此 外 ， 还 
有 两 个 重要 的 关系 完整 性 规则 ， 即 应 用 于 数据 库 所 有 实例 的 约束 或 限制 。 关系 模型 的 这 两 个 
重要 规则 就 是 所 说 的 实体 完整 性 和 参照 完整 性 。 在 我 们 定义 这 些 术 语 之 前 ， 我 们 首先 需要 理 
解 空 值 的 概念 。 
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2.3.1 空 值 





| 空 值 (Null) 表示 二 不 列 的 值 目前 还 不 知道 或 者 对 于 当前 记录 来 说 还 不 能 使 用 。 | 


空 值 可 以 意味 着 “不 知道 ， 也 可 以 意味 着 某 个 记录 没有 值 ， 或 者 只 是 意味 着 该 值 还 没 
有 提供 。 空 值 是 处 理 不 完整 数据 或 异常 数据 的 一 种 方式 。 但 是 ， 空 值 与 数字 零 或 者 用 空 空格 填 
充 的 字符 串 不 同 ， 零 和 空格 是 值 ， 但 空 值 代表 没有 值 。 因 此 ， 空 值 应 该 与 其 他 值 区 别 对 待 。 

例如 ， 假 定 一 个 分 公司 暂时 没有 负责 人 是 可 能 的 ， 这 可 能 因为 负责 人 最 近 离开 了 ， 而 新 
的 负责 人 还 没有 上 任 。 这 时 ， 相 应 的 mgrStaffNo 列 的 值 就 是 没有 定义 的 。 如 果 没 有 空 值 ， 就 
必须 引入 错误 的 数据 来 代表 这 种 状态 或 者 增加 额外 的 可 能 根本 对 用 户 没有 意义 的 列 。 在 这 个 
例子 中 ， 我 们 就 要 用 “不 存在 - 这 个 值 来 描述 没有 负责 人 。 或 者 ， 我 们 为 Branch 表 增加 新 的 
列 “currentManager?”， 如 果 有 人 负责 人 ， 值 为 Y( 是 )， 否 则 ， 值 为 N( 否 )。 这 两 种 方法 都 会 令 使 
用 数据 库 的 人 困惑 。 

有 了 空 值 的 定义 ， 我 们 现在 就 开始 定义 两 种 关系 完整 性 规则 。 


2.3.2 实体 完整 性 
第 一 个 完整 性 规则 应 用 于 基本 表 的 主键 上 。 












实体 完整 性 (Entity Integrity) ”在 一 个 基本 表 中 ， 主 键 列 的 取 值 不 能 为 空 。 














基本 表 (Base Table ) 命名 的 表 ， 其 中 的 记录 物理 地 存储 在 数据 库 中 。 这 与 我 们 在 
1.2.4 节 中 提 到 的 视图 不 同 。 视 图 是 “虚拟 的 表 ”， 它 并 不 真正 存在 于 数据 库 中 ， 而 是 在 
访问 时 由 DBMS 从 基本 表 中 产生 的 。 


从 前 面 介绍 的 定义 中 ， 我 们 知道 主键 是 用 于 唯一 标识 记录 的 最 小 的 标识 。 这 意味 着 主键 
的 任何 子 集 都 不 能 提供 记录 的 唯一 标识 。 如 果 我 们 允许 空 值 作为 主键 的 一 部 分 ， 则 就 意味 着 
并 不 是 所 有 的 列 都 用 来 区 分 记录 ， 这 与 主键 的 定义 了 矛盾。 例如 ，branchNo 是 Branch 表 的 主键 ， 
我 们 不 应 该 在 插入 记录 的 时 候 ， 使 branchNo 列 的 值 为 空 


2.3.3 参照 完整 性 
第 二 个 完整 性 规则 应 用 于 外 键 上 。 


参照 完整 性 (Referential Integrity) “如果 表 中 存在 外 键 ， 则 外 键 值 必 须 与 主 表 中 的 某 


些 记 录 的 候选 键 值 相 同 ， 或 者 外 键 的 值 必 须 全 部 为 空 。 





在 图 2-1 中 ，Staff 表 中 的 branchNo 是 主 表 Branch 的 branchNo 列 的 外 键 。 例 如 ， 在 Staff 表 中 
应 该 不 能 创建 分 公司 号 码 为 B300 的 员工 号 码 ， 除 非 在 Branch 表 中 已 经 存在 号 码 为 B300 的 分 公 
司 。 但 是 ， 我 们 应 该 可 以 创建 分 公司 号 码 为 空 的 新 的 员工 记录 ， 即 允许 发 生 这 样 的 情况 ， 该 
新 员工 已 经 加 入 了 公司 ， 但 还 没有 分 派 到 某 个 具体 的 公司 。 


2.3.4 业务 规则 


业务 规则 (Business Rule) ”定义 或 约束 组 织 的 某 些 方面 的 规则 。 
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业务 规则 的 例子 包括 域 和 关系 完整 性 规则 ， 域 用 于 约束 特定 列 能 够 取 的 值 ， 关 系 完整 性 
规则 在 前 面 刚 讨 论 过 。 另 一 个 例子 是 多 样 性 ， 它 定义 某 个 实体 (比如 一 个 分 公司 ) 可 能 在 另 
一 个 实体 (比如 每 个 雇员 ) 中 有 若干 次 出 现 。 用 户 也 可 以 指定 数据 必须 满足 的 其 他 约束 。 例 
如 ， 如 果 StayHome 有 这 样 的 规则 : 每 个 成 员 一 次 最 多 只 能 借 10 盘 录像 ， 那 么 用 户 必 须 能 说 明 
该 规则 ， 并 希望 DBMS 实 现 它 。 这 时 ， 如 果 某 成 员 当前 租 的 录像 的 数量 是 10 盘 ， 则 该 成 员 就 
应 该 不 能 再 租 新 的 了 。 

遗憾 的 是 ， 不 同 的 系统 对 业务 规则 的 支持 程度 是 不 同 的 。 我 们 在 第 12 章 和 第 18 章 讨论 业 
务 规则 的 实现 。 


2.4 关系 语言 


在 2.1 节 中 ， 我 们 提出 了 数据 模型 的 一 个 部 分 是 操作 部 分 ， 此 部 分 定义 了 允许 对 数据 进行 
的 操作 ， 包 括 从 数据 库 中 更 新 或 检索 数据 所 用 的 操作 以 及 改变 数据 库 结构 的 操作 。 关 系 
DBMS 的 这 两 种 主要 语言 是 : 

*。 SQL(Structured Query Language) 

。QBE(Query-by-Example) 

SQL 已 经 被 国际 标准 化 组 织 (ISO ) 进行 了 标准 化 ， 使 它 成 为 正式 的 和 实际 上 的 定义 和 操 
纵 关 系数 据 库 的 标准 语言 。 

QBE 是 另 一 种 方法 ， 它 是 基于 图 形 的 .“ 点 击 ”查询 数据 库 的 方式 ， 尤 其 适合 于 不 太 复杂 并 
且 只 用 几 张 表 就 可 以 表达 的 查询 。QBE 是 对 于 非 专业 用 户 从 数据 库 中 获得 信息 的 最 简单 的 方式 
之 一 。 遗 憾 的 是 ， 同 SQL 不 一 样 ， 这 个 语言 没有 官方 标准 。 但 是 ， 开 发 商 所 提供 的 功能 通常 都 
很 相似 ， 并 且 这 些 语 言 的 使 用 通常 比 SQL 更 直观 。 我 们 将 在 下 一 章 对 SQL 和 QBE 进 行 介绍 。 


2.5 本 章 小 结 


“关系 数据 库 管理 系统 (RDBMS ) 目前 已 经 成 为 主流 的 DBMS 。 这 个 软件 代表 了 第 二 代 
DBMS ， 它 基于 E.F.Codd 博 士 提 出 的 关系 数据 模型 。 

“关系 在 物理 上 描述 为 表 ， 记 录 对 应 每 个 元 组 ， 而 列 对 应 属性 。 

“关系 表 的 特点 是 : 每 个 单元 只 包含 一 个 值 、 列 名 唯一 、 列 值 来 自 相 同 的 域 、 列 的 顺序 不 
重要 、 记 录 的 顺序 不 重要 ， 并 且 设 有 重复 的 记录 。 

“ 超 键 是 唯一 标识 表 中 记录 的 列 集合 。 候 选 键 是 最 小 的 超 键 。 主 键 是 选 出 来 唯一 标识 表 中 
记录 的 候选 键 ， 每 个 表 必 须 有 一 个 主键 。 外 键 就 是 一 个 列 或 多 个 列 ， 这 ( 些 ) 列 是 其 他 
表 (也 可 能 是 本 身 ) 中 的 候选 键 。 

* 空 值 表 示 此 列 的 值 目 前 “不 知道 ”"， 或 者 对 于 此 记录 没有 定义 。 

* 实体 完整 性 是 一 个 约束 ， 表 明 在 基本 表 中 ， 主 键 的 列 不 能 为 空 。 参 照 完整 性 是 如 果 表 中 
存在 外 键 ， 则 外 键 的 值 必须 与 主 表 中 的 某 些 记录 的 候选 键 值 相同 ， 或 者 外 键 的 值 必须 全 

* 访问 关系 数据 库 的 两 种 主要 语言 是 SQL 和 QBE。 


复习 题 
2.1 在 关系 数据 模型 语 境 中 讨论 下 述 每 个 概念 。 





2.2 
2.3 


2.4 
2.5 


条 2 间 类 夭 模 型 23 


(a) 关系 

(b) 属性 

(c) 域 

(d) 元 组 

(e) 关系 数据 库 

讨论 关系 表 的 属性 。 

讨论 一 个 表 中 候选 键 和 主键 间 的 区 别 ， 解 释 外 键 的 含义 。 表 的 外 键 是 如 何 与 候选 键 
关联 的 ? 用 例子 来 说 明 你 的 答案 。 

空 值 的 含义 是 什么 ? 

为 关系 模型 定义 两 个 主要 的 完整 性 规则 ， 讨 论 为 什么 强制 执行 这 些 规则 。 








第 3 章 SQL 和 QBE 


本 章 主题 : 
“ 关系 数据 库 主 要 查询 语言 SQL ( Structured Query Language， 结 构 化 查询 语言 ) 的 目的 
和 重要 性 。 

* 如何 使 用 SELECT 语句 检索 数据 库 中 数据 。 

* 如 何 使 用 INSERT 语 句 向 数据 库 中 插入 数据 。- 

* 如 何 使 用 UPDATE 语 句 更 新 数据 库 中 的 数据 。 

* 如 何 使 用 DELETE 语 句 从 数据 库 中 删除 数据 。 

* 如 何 使 用 CREATE TABLE 语 句 在 数据 库 中 创建 新 表 。 

“ 另 一 种 关系 数据 库 查询 语言 QBE ( Query -by-Example ) 。 

在 前 面 的 几 章 中 ， 我 们 已 经 介绍 了 关系 数据 模型 ， 并 指出 在 关系 数据 库 管理 系统 
(DBMS ) 中 的 两 种 主要 的 语言 。 

。SQL 

。QBE 

QBE 本 质 上 是 SQL 的 图 形 化 的 前 端 ， 它 能 提供 一 种 比 SQL 更 简单 的 查询 关系 数据 库 的 方 
法 。 然 而 ， QBE 能 够 将 用 图 形 描述 的 查询 转变 成 相应 的 SQL 语 句 ， 从 而 在 数据 库 上 运行 。 在 
本 章 中 ， 虽 然 因为 SQL 的 重要 地 位 ， 我 们 将 主要 关注 SQL 语言 ， 但 我 们 会 对 这 两 种 语言 都 进 
行 介绍 。 如 果 读 者 有 兴趣 查阅 有 关 SQL 和 QBE 更 完整 的 讨论 ， 可 以 参考 2002 年 Connolly 和 
Begg 合 作出 版 的 书 。 


3.1 结构 化 查询 语言 


SQL 是 一 种 应 用 最 为 普遍 的 商业 关系 数据 库 语言 ， 非 专业 人 士 和 专业 人 士 一 样 可 以 很 好 
地 使 用 它 。 在 1974~1977 年 间 ， 它 本 是 IBM 的 San Jose 研 究 实验 室 在 SEQUEL 和 System-R 项 目 
开发 的 一 部 分 。 如 今 ， 尽管 官方 规定 SQL 应 读 作 “S-Q-L”， 但 仍 有 很 多 人 将 它 读 作 “See 
Quel 。 从 20 世 纪 70 年 代 末 期 Oracle 开 始 ， 已 经 出 现 了 很 多 基于 SQL 的 商业 关系 数据 库 管 理 系 
统 (RDBMS )。 在 ANSI ( 美国 国家 标准 化 组 织 ) 和 ISO (国际 标准 化 组 织 ) 制定 了 SQL 标准 
后 ， SQL 已 经 成 为 现在 定义 和 操纵 关系 数据 库 的 正式 的 事实 土 的 语言 了 。 

SQL 的 主要 特点 有 : 

"学习 起 来 相对 容易 。 

“ 它 是 一 种 非 过 程 化 语言 : 你 只 需 指 定 需要 什么 数据 而 不 需要 指定 怎样 得 到 这 些 数据 ， 也 

就 是 说 ， SQL 不 需要 你 指定 访问 数据 的 方法 。 

“ 与 大 多 数 现代 语言 一 样 ，SQL 的 语 言 格式 自由 ， 即 语句 并 不 需要 在 屏幕 的 特定 位 置 输入 ， 

* 其 命令 结构 由 标准 英语 单词 组 成 ， 如 SELECT、INSERT、UPDATE 和 DELETE， 

“ 它 可 以 被 很 多 用 户 使 用 , .包括 数据 库 管理 员 (DBA)、 管 理 层 职员 、 应 用 程序 员 以 及 其 

他 最 终 用 户 。 
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SQL 语言 非常 重要 ， 其 原因 如 下 : 

。 SQL 是 第 一 种 (也 是 到 目前 为 止 唯 -的 一 种 ) 能 够 被 广泛 采纳 的 标准 数据 库 语 言 。 当 前 ， 
几乎 任何 一 个 重要 的 开发 商都 提供 基于 SQL 或 拥有 SQL 接口 的 数据 库 产品 ， 而 且 大 多 数 
开发 商 至 少 代表 了 一 部 分 制定 标准 的 主体 。 

.SQL 语言 为 开发 商 和 用 户 都 提供 了 无 限 的 商机 。 它 成 为 如 IBM SAA (IBM Systems 
Application Architecture，IBM 系 统 应 用 体系 结构 ) 之 类 的 应 用 体系 结构 的 一 部 分 ， 并 
且 成 为 很 多 大 规模 、 有 影响 力 的 组 织 (如 UNIX 标 准 的 X/OPEN 联 盟 ) 的 战略 选择 。 

。SQL 也 成 为 Federal Information Processing Standard (FIPS ， 信 息 处 理 标 准 联盟 ) ， 使 卖 
给 US 政府 的 所 有 DBMS 都 保持 一 致 。 

.SQL 还 被 应 用 在 其 他 的 标准 中 ， 甚 至 作为 一 种 定义 工具 影响 着 其 他 标准 的 开发 (比如 ， 
ISO 远程 数据 访问 (RDA) 标准 。) 

在 我 们 深入 学 习 SQL 例 子 之 前 ， 先 介绍 一 下 SQL 的 目标 。 


3. 


.1 SQL 的 目标 


理想 情况 下 ， 一 种 数据 库 语言 应 该 允许 用 户 进行 以 下 操作 : 

。 创建 数据 库 和 表 结 构 。 

。 实 现 基本 的 数据 管理 工作 ， 比 如 插入 、 修 改 或 删除 表 中 数据 。 

。 能 够 实现 简单 和 复杂 的 查询 。 

另外 ， 一 种 数据 库 语 言 首先 必须 以 用 户 最 小 的 代价 执行 上 述 工作 ; 其 次 ， 它 的 命令 结构 
和 语法 都 必须 易于 学 习 ; 最 后 ， 它 必须 是 可 移植 的 : 即 它 必 须 符合 一 些 已 被 承认 的 标准 。 只 
有 这 样 ， 当 我 们 需要 把 数据 从 一 个 DBMS 系 统 转移 到 另外 一 个 DBMS 系 统 中 时 ， 才 能 延续 使 用 
与 原来 相同 的 命令 结构 和 语法 。SQL 是 符合 以 上 要 求 的 一 种 数据 库 语 言 。 

SQL 是 一 个 面向 转换 (transform-oriented) 的 语言 的 例子 ， 或 者 说 是 一 种 用 于 把 数据 从 输 
入 表 转 换 到 要 求 的 输出 表 而 设计 的 一 种 语言 。ISO SQL 标准 包含 两 个 主要 组 成 部 分 : 

。 用 于 定义 数据 库 结 构 和 控制 数据 存 取 的 数据 定义 语言 (DDL ) 。 

。 用 于 检索 和 更 新 数据 的 数据 操纵 语言 (DML ) 。 

在 1999 年 ISO SQL 标准 的 最 新 版 本 ( 即 常 说 的 SQL3) 发 布 之 前 ，SQL 仅 包含 这 些 定义 命 
令 和 操纵 命令 ， 不 包含 流程 控制 命令 ， 如 IF...THEN...ELSE、GO TO 或 DO...WHILE。 这 些 都 
需要 通过 程序 或 作业 控制 语言 ， 或 终端 用 户 的 交互 来 实现 。 由 于 缺少 最 基本 的 计算 功能 ， 
SQL 有 两 种 使 用 方法 。 第 一 种 方法 是 通过 终端 交互 地 输入 语句 来 使 用 SQL。 第 二 种 方法 是 在 
过 程 化 语言 中 嵌入 SQL 语句 。 在 本 书 中 ， 我 们 只 考虑 交互 式 SQL。 若 想 了 解 戏 入 式 SQL 的 详细 
情况 ， 可 以 参考 2002 年 Connolly 和 Begg 合 作出 版 的 书 。 


SQL 一 致 性 (SQL Conformance) ”SQL3 有 一 系列 称 之 为 核心 SQL 的 特性 ， 开 发 商 必 须 遵 照 
SQL3 标 准 实现 这 些 特性 。 其 他 的 很 多 特性 被 划分 到 包 中 ; 比如 ， 对 象 特征 包 和 OLAP (联机 





分 析 处 理 ) 包 。 开 发 商 往往 还 会 实现 一 些 附 加 的 功能 ， 尽 管 这 确实 会 影响 SQL 的 可 移植 性 。 


3.1.2 术语 


ISO SQL 标 准 没有 使 用 关系 、 属 性 和 元 组 这 些 形式 化 的 术语 ， 而 是 采用 表 、 列 和 行 这 些 
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术语 。 我们 对 SQL 的 介绍 大 多 都 采用 ISO 术 语 。 需 要 特别 指出 的 是 ，SQL 并 没有 严格 遵守 第 2 
章 描 述 的 关系 模式 的 定义 。 例 如 ，SQL 人 允许 SELECT 操作 产生 的 结果 表 包 含 重复 行 ; 它 可 以 按 
表 中 的 列 进行 排序 ; 而 且 ， 它 允许 用 户 定义 表 中 行 的 排列 顺序 。 


3.1.3 书写 SQL 命令 


在 这 一 节 中 ， 我 们 将 简要 描述 SQL 语句 的 结构 和 用 来 定义 各 种 SQL 结构 的 格式 的 符号 。 
一 个 SQL 语句 由 保留 字 和 用 户 定义 的 词组 成 。 保 留 字 是 SQL 语言 的 固定 部 分 ， 而 且 有 它 固 定 
的 语义 。 它 们 必须 与 要 求 的 拼写 完全 一 致 ， 而 且 不 能 跨行 写 。 用 户 定义 的 词 是 由 用 户 创造 的 
(符合 一 定 的 语法 规则 )， 代 表 各 种 数据 库 对 象 ， 如 表 、 列 、 视 图 、 索 引 等 等 。 在 本 章 中 ,我 
们 用 大 写字 母 代表 保留 字 ， 小 写字 母 代 表 用 户 定 义 的 单词 。 

SQL 语句 一 般 都 不 区 分 大 小 写 ， 也 就 是 说 ， 字 母 可 以 用 大 写 也 可 以 用 小 写 。 该 规则 的 唯 
一 特例 是 ， 字 符 数 据 的 拼写 必须 和 它 在 数据 库 中 的 拼写 完全 一 致 。 例 如 ， 如 果 我 们 在 数据 库 
中 把 一 个 人 的 姓 存 为 “SMITH"”， 然 后 又 用 字符 串 “Smith” 进 行 查找 ， 则 该 行将 无 法 找到 。 
语句 中 的 词 也 根据 一 组 语法 规则 来 建立 。 尽 管 标准 没有 要 求 ， 但 是 很 多 SQL 的 变种 都 要 求 使 
用 语句 结束 符 来 标志 每 个 SQL 语 名 的 结束 (一般 都 用 分 号 “; ”)。 

在 本 章 中 ， 我 们 用 下 列 BNE 符 号 的 扩展 形式 来 定义 SQL 语句 : 

“垂直 线 (1) 表示 在 其 中 任 选 一 个 。 例 如 ，alblec。 

。 大 括号 表示 必需 的 元 素 。 例 如 ，{a}。 

* 方 括号 代表 可 选 元 素 。 例 如 ，[a]。 

“省略 号 (…) 用 来 代表 某 一 项 可 以 重复 0 到 多 次 。 

例如 ，{alb} ( ,c… ) 表示 a 或 b 后 面 跟随 0 个 或 多 个 由 逗号 隔 开 的 c。 

实际 上 ，DDL 语 名 用 于 创建 数据 库 的 结构 ( 即 表 ) 和 访问 机 制 ( 即 每 位 用 户 能 够 进行 的 
合法 访问 )， 而 DML 语 名 是 用 于 填充 和 查询 表 的 。 但 在 本 书 中 ， 我 们 主要 关注 DML 语 句 ， 以 
反映 它们 对 于 一 般 用 户 的 相对 重要 性 。 


3.2 数据 操纵 


在 这 一 节 中 ， 我 们 将 研究 SQL 的 DML 语 句 ， 即 ; 

“SELECT 用 来 查询 数据 库 中 的 数据 。 

“ INSERT 用 来 向 表 中 加 入 数据 行 。 

“ UPDATE 用 来 更 新 表 中 的 数据 。 

"DELETE 用 来 从 表 中 删除 数据 。 

因为 SELECT 语句 比较 复杂 而 其 他 DML 语 名 相对 容易 ， 所 以 我 们 将 花 大 部 分 篇 幅 来 讲述 
SELECT 语 句 和 它 的 各 种 形式 。 我 们 将 从 简单 的 查询 开始 ， 然 后 提高 难度 ， 说 明 如 何 产生 带 有 
排序 (sort)、 分 组 (group)、 聚 合 (aggregate) 功能 的 查询 ， 以 及 涉及 多 表 的 查询 。 然 后 ， 
我 们 将 考虑 INSERT、UPDATE 和 DELETE 语 句 。 

我 们 用 图 2-4 中 所 示 的 StayHome 示 例 数据 库 来 举例 说 明 SQL 语 句 。 该 数据 库 主 要 包括 下 列表 : 


Staff (staffNo, name, position, salary, branchNo) 
Video (catalogNo, title, category, dailyRental, price, directorNo) 
Director (directorNo, directorName) 


Actor (actorNo, actorName) 
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Role (actorNo, catalogNo, character) 

RentalAgreement (rentalNo, dateOut, dateReturn, memberNo, videoNo) 
VideoForRent (videoNo, available, catalogNo, branchNo) 

文字 


在 我 们 讨论 SQL DML 语 句 之 前 ， 我 们 有 必要 理解 文字 的 概念 。 文 字 是 在 SQL 语 名 中 使 用 的 
常量 ，SQL 支 持 的 任何 一 种 数据 类 型 都 有 不 同 的 文字 形式 。 但 是 ， 为 简化 起 见 ， 我 们 可 以 将 它 
们 分 为 包含 在 单 引号 之 中 的 文字 和 不 包含 在 单 引号 中 的 两 类 。 所 有 非 数字 型 的 数据 值 必 须 包含 
在 单 引号 之 中 ， 所 有 数字 型 的 数据 值 必须 不 加 单 引 号 。 例 如 ， 我 们 用 文字 向 一 张 表 中 加 入 数据 : 

INSERT INTO Video (catalogNo, title, category, dailyRental, price, directorNc,) 

VALUES ('207132', 'Die Another Day', ‘Action', 5.00, 21.99, 'D1001'); 


列 dailyRental 和 price 属 于 数字 文字 ， 它 们 没有 单 引 号 ; 而 其 他 的 列 都 是 字符 串 型 的 ， 并 
且 列 值 都 包含 在 单 引号 之 中 。 
3.2.1 简单 查询 


SELECT 语句 的 目的 是 从 一 个 或 多 个 数据 库 表 中 检索 和 显示 数据 ， 这 是 一 个 功能 非常 强大 
的 命令 ， 也 是 最 常 使 用 的 SQL 命令 。SELECT 语 名 的 一 般 格 式 如 下 : 


SELECT [DISTINCT | ALL] {* | [columnExpression [RS newName]}[,...}} 
FROM TableName [alias]j[,...] 

[WHERE condition] 

(GROUP BY columnList] {HAVING condition] 

[ORDER BY columnList] 


。columnExpression 代 表 一 个 列 名 或 一 个 表达 式 。 

。newName 是 你 给 定 的 用 来 显示 的 列 标题 名 称 。 
。TableName 是 想 访问 的 已 存在 的 数据 库 表 或 视图 的 名 称 。 
。alias 是 TableName 的 可 供 选 择 的 缩写 名 称 。 














组 成 SELECT 语句 的 子 句 有 : 

FROM 指定 用 到 的 一 个 或 多 个 表 
WHERE 按照 某 些 条 件 过 滤 行 数据 
GROUP BY 按 相 同 的 列 值 将 行 分 成 组 
HAVING 按照 基 些 条 件 过 汗 组 数据 
SELECT 指定 在 输出 结果 中 出 现 的 列 
ORDER BY . 指定 输出 的 排列 顺序 


SELECT 语句 中 各 子 句 的 顺序 不 能 改变 。 其 中 只 有 前 两 个 子 句 是 必需 的 : SELECT 和 
FROM; 剩 下 的 子 句 都 是 可 选 的 。 每 个 SELECT 语句 将 产生 一 个 查询 结果 表 ， 它 由 一 个 或 多 个 
列 以 及 0 行 或 多 行 结果 组 成 。 

查询 3.1 检索 所 有 的 行 和 列 

列 出 所 有 录像 的 全 部 详细 情况 

由 于 在 该 查询 中 没有 限制 条 件 〈 即 我 们 将 列 出 Video 表 中 的 所 有 行 )， 所 以 不 需要 WHERE 





子 句 。 我 们 可 以 编写 以 下 查询 : 
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SELECT catalogNo, title, category, dailyRental, price, directorNo 
FROM Video; 


当 希 望 列 出 一 个 表 中 的 所 有 列 时 ， 可 以 用 星 号 (*) 代替 列 名 。 因 此 ， 上 面 的 查询 也 可 以 写 为 : 


SELECT * 
FROM Video; 


上 述 任 何 一 种 方法 都 可 以 得 到 表 3-1 所 示 的 结果 表 。 
表 3-1 查询 3.1 的 结果 表 


catalogNo title category dailyRental price directorNo 
207132 Die Another Day Action 5.00 21.99 D1001 
902355 Harry Potter Children 4.50 14.50 D7834 
330553 Lord of the Rings Fantasy 5.00 31.99 D4576 
781132 Shrek Children 4.00 18.50 D0078 
445624 Men in Black JI Action 4.00 29.99 D5743 
634817 Independence Day Sci-Fi 4.50 32.99 D3765 





查询 3.2 ”查询 指定 的 列 、 所 有 行 

列 出 所 有 录像 的 种 类 号 、 名 称 和 日 租金 额 

在 本 查询 中 也 没有 指定 限制 条 件 ， 所 以 也 不 需要 WHERE 子 句 。 但 是 ， 我 们 只 希望 列 出 全 
部 列 的 一 个 子 集 ， 我 们 可 以 编写 以 下 查询 : 

SELECT catalogNo, title, dailyRental 

FROM Video; 

表 3-2 显 示 了 该 查询 的 结果 表 。 注 意 ， 在 这 个 结果 中 你 会 发 现 除非 指定 排列 顺序 ， 否 则 结 
果 表 不 会 对 行进 行 排序 。 我 们 将 在 下 一 节 介 绍 怎样 对 结果 表 中 的 行进 行 排序 。 


表 3-2 查询 3.2 的 结果 表 
一 -一 一 


catalogNo title dailyRental 
207132 Die Another Day 5.00 
902355 Harry Potter 4.50 
330553 Lord of the Rings 5.00 
781132 Shrek 4.00 
445624 . Men in Black II 4.00 
634817 Independence Day 4.50 


一 
查询 3.3 使 用 DISTINCT . 
列 出 所 有 录像 的 种 类 号 
SELECT catalogNo 
FROM Video; 
结果 表 如 表 3-3a 所 示 。 注 意 ， 在 结果 表 中 有 一 些 重复 的 值 (默认 情况 下 ， SELECT 语句 不 
会 将 重复 值 去 掉 )。 若 要 去 掉 重 复 值 ， 可 以 用 DISTINCT 关 键 字 重 写 上 述 查询 : 


SELECT DISTINCT catalogNo 
FROM Video; 


这 样 ， 我 们 将 得 到 表 3-3b 所 示 的 结果 。 
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表 3-3 










b) 略 去 重复 值 的 查询 3.3 的 结果 










a) 查询 3.3 包 含 重复 值 的 结 》 





category 








category 

Action Action 
Children Children 
Fantasy Fantasy 
Children Sci-Fi 
Action 





Sci-Fi 


查询 3.4 计算 字段 

列 出 租借 录像 三 天 的 租金 

SELECT catalogNo, titljle, dailyRental*3 
FROM Video; 


这 个 查询 和 查询 3.2 很 相似 ， 不 同 的 是 ， 我 们 将 计算 三 天 的 租金 而 不 只 是 一 天 的 租金 。 在 
这 种 情况 下， 我 们 可 以 通过 将 每 天 的 租金 乘 3 得 到 三 天 的 租金 ， 查 询 结果 见 表 3-4。 

这 是 使 用 计算 字段 (有 时 也 称 为 派生 的 字段 ) 的 例子 。 一 般 来 说 ， 要 使 用 计算 字段 ， 你 
可 以 在 SELECT 列表 中 指定 一 个 SQL 表达 式 。 一 个 SQL 表达 式 可 以 包含 加 、 减 、 乘 、 除 运算 ， 
而 且 还 可 以 使 用 圆 括号 构建 复杂 的 表达 式 。 可 以 在 计算 列 中 使 用 多 个 表 中 的 列 ， 但 是 .在 算 
术 表 达 式 中 引用 的 列 必 须 都 是 数值 类 型 的 。 

在 该 结果 表 中 ， 第 三 列 显示 为 co13 。 通 常情 况 下 ， 结 果 表 中 的 列 与 检索 的 数据 库 表 中 相应 
的 列 有 相同 的 名 字 。 但 是 ， 人 在 这 种 情况 下 ，SQL 不 知 该 如 何 标识 该 列 。 有 些 系统 根据 该 列 在 
表 中 的 位 置 取 名 (如 col3 )， 也 有 些 系统 会 将 该 列 名 置 空格 或 用 SELECT 语句 中 的 表达 式 作 列 
名 。SQL 标 准 人 允许 用 AS 子 句 来 为 列 命名 。 对 于 前 面 的 查询 ， 我 们 可 以 写作 : 


SELECT catalogNo, title, dailyRental*3 AS threenayRate 
FROM Video; 


这 样 ， 在 结果 表 中 列 的 标题 就 是 threeDayRate 而 不 是 col3。 
表 3-4 查询 3.4 的 结果 表 








catalogNo title co13 

207132 Die Another Day 15.00 
902355 Harry Potter 13.50 
330553 Lord of the Rings 、 15.00 
781132 Shrek 12.00 
445624 Men in Black II 12.00 
634817 Independence Day 13.50 

3.2.2 选择 行 


前 面 的 例子 说 明了 如 何 用 SELECT 语句 从 表 中 检索 所 有 行 。 但 是 ， 我 们 经 常 需要 限制 要 检 
索 的 行 。 这 可 以 通过 WHERE 子 句 来 实现 ，WHERE 子 句 由 关键 字 WHERE 和 指定 需要 检索 的 
行 的 查询 条 件 组 成 。 下 面 列 出 了 五 种 基本 的 查询 条 件 (在 ISO 术语 中 称 为 “谓词 * ): 

“ 比较 : 比较 一 个 表达 式 值 与 另 一 个 表达 式 的 值 。 

* 范围 : 检验 一 个 表达 式 的 值 是 否 在 指定 的 值 范围 内 。 
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。 集 合成 员 : 检查 一 个 表达 式 的 值 是 否 等 于 集合 中 的 某 个 值 。 
* 模式 匹配 : 检查 一 个 字符 串 是 否 匹 配 一 个 指定 的 模式 。 

。 空 值 (null): 检查 列 中 是 否 有 空 值 (未知 值 )。 

下 面 将 举例 说 明 这 些 查 询 条 件 的 使 用 。 

查询 3.5 比较 查询 条 件 

列 出 所 有 年 薪 高 于 $40000 的 员工 的 信息 

SELECT staffNo, ncome, position, salary 


FROM Staff 
WHERE salary > 40000; 


在 该 查询 中 ， 我 们 需要 将 Staff 表 中 salary 列 的 值 大 于 $40000 的 行 选择 出 来 。 为 达到 该 目的 ， 
我 们 指定 WHERE 子 名 的 条 件 ( 谓词) 为 “salary > 40000”。 结 果 表 如 表 3-5 所 示 。 
表 3-5 查询 3.5 的 结果 表 








staffNo name position salary 
S1500 Tom Daniels Manager 46000 
S0010 Mary Martinez Manager 50000 
S2250 Sally Stern Manager 48000 
S0415 | Art Peters Manager 41000 








在 SQL 中 ， 下 列 简单 的 比较 运算 符 是 有 效 的 : 
= 等 于 <> 不 等 于 

< 小 于 ”<= 小 于 等 于 

> 大 于 >= 大 于 等 于 

利用 AND、OR 和 NOT 逐 辑 运算 符 可 以 生成 更 复杂 的 谓词 ， 可 以 用 圆 括号 (如果 需 要 
的 话 ) 表示 运算 的 先后 顺序 。 条 件 表 达 式 的 运算 规则 如 下 : 

。 表 达 式 从 左 往 右 计 算 。 

。 先 计算 圆 括号 中 的 子 表 达 式 。 

。NOT 的 优先 级 比 AND 和 OR 高 。 

。AND 的 优先 级 比 OR 高 。 

通常 推荐 使 用 圆 括号 来 改变 运算 顺序 ， 因 为 它 可 以 除去 可 能 的 二 义 性 。 


查询 3.6 范围 查询 条 件 (BETWEEN / NOT BETWEEN) 
列 出 所 有 年 薪 在 $45000 和 $50000 之 间 的 员工 信息 4 


SELECT staffNo, ncome, position, salary 
FROM Staff 
WHERE salary >=.45000 AND salary <= 50000; 


在 这 个 查询 中 ， 我 们 在 WHERE 子 句 中 使 用 逻辑 运算 符 AND 来 查找 Staff 表 中 salary 列 值 在 
$45000 和 $50000 之 间 的 行 。 结 果 如 表 3-6 所 示 。 SQL 也 提供 了 范围 测试 BETWEEN 来 检测 一 个 
数据 值 是 否 在 指定 的 一 对 值 之 间 。 我 们 可 以 将 前 面 的 查询 重 写 为 : 

SELECT staffNo, ncome, position, salary 


FROM Staff 
WHERE salary BETWEEN 45000 AND 50000; 
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BETWEEN 测 试 包含 边界 两 端的 值 ， 所 以 年 薪 为 $45000 或 $50000 的 工作 人 员 也 将 包含 在 
结果 表 中 。 还 有 一 个 否定 版 本 的 范围 测试 (NOT BETWEEN) 可 以 用 来 检测 在 该 范围 之 外 的 
值 。BETWEEN 测 试 并 没有 增强 SQL 表 达 式 的 表达 能 力 ， 就 像 我 们 看 到 的 ， 它 的 表达 能 力 和 两 
个 比较 测试 的 表达 能 力 相同 。 

表 3-6 查询 3.6 的 结果 表 








staffNo name position salary 
S1500 Tom Daniels Manager 46000 
S0010 Mary Martinez Manager 50000 
S2250 Sally Stern Manager 48000 
查询 3.7 集合 成 员 查 询 条 件 (IN / NOT IN) 
列 出 动作 类 和 儿童 类 的 所 有 录像 


SELECT catalogNo, title, category 
FROM Video 
WHERE category = ‘Action' QR category = ‘Children'; 


如 前 所 示 ， 我 们 可 以 在 WHERE 子 句 中 用 一 个 复合 的 查询 条 件 来 表达 该 查询 。 结 果 如 表 
3-7 所 示 。 但 是 ，SQL 还 提供 了 一 个 集合 成 员 关 键 字 IN 来 测试 列 值 是 否 匹配 值 列表 中 的 某 个 值 。 
我 们 可 以 用 IN 测试 重新 表述 该 查询 为 : 

SELECT catalogNo, title, category 


FROM Video 
WHERE category IN ( 'Action' , 'Children'}; 


还 有 一 个 否定 版 本 的 集合 成 员 查 询 条件 (NOT IN) 可 以 用 来 检测 数据 值 是 否 在 所 列 列表 
之 外 。 与 BETWEEN 相 似 ，IN 测 试 也 没有 增强 SQL 表 达 式 的 表达 能 力 ， 但 是 ，IN 测 试 为 我 们 
表达 查询 条 件 提供 了 一 种 更 有 效 的 表达 方法 ， 尤 其 是 当 该 集合 包含 多 个 值 时 。 

表 3-7 查询 3.7 的 结果 表 : 
一 一- ”~ 


catalogNo title category 
207132 Die Another Day Action 
902355 Harry Potter Children 
781132 Shrek Children 
445624 Men In Black I Action 


查询 3.8 模式 匹配 查询 条 件 (LIKE / NOT LIKE) 
列 出 所 有 名 为 “Sally” 的 员工 信息 








SQL 有 以 下 两 种 模式 匹配 符号 : 
% 百 分 号 代表 0 个 或 多 个 字符 序列 (通配符 )。 
-~ 下 划 线 代表 一 个 字符 。 

在 模式 中 的 其 他 字符 都 代表 其 本 身 ， 比 如 : 

“name LIKE 'S%' 代表 第 一 个 字母 必须 为 S$， 但 是 字符 事 其 他 部 分 内 容 不 限 。 

“name LIKE 'S____' 代 表 第 一 个 字母 必须 为 $， 且 字符 囊 必须 为 5 个 字母 。 

"name LIKE '%S' 代表 任何 长 度 的 字母 序列 ， 序 列 长 度 至 少 为 1， 且 最 后 一 个 字母 必须 为 S。 
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。name LIKE '%Sally%' 代表 任何 内 容 中 包含 Sally 的 字符 串 。 
“name NOT LIKE 'S%' 代表 第 一 个 字母 不 是 S 的 任意 字符 囊 。 


如 果 查 询 字 符 事 中 包含 模式 匹配 字符 ， 我 们 可 以 用 ESCAPE ( 转 义 字符 ) 来 表示 这 是 
模式 匹配 标识 待 。 比 如 ,检验 字符 串 '15%'， 我 们 可 以 用 谓词 : 


LIKE '15#%' ESCAPE ‘#' 





利用 SQL 的 模式 匹配 查询 条 件 ， 我 们 可 以 用 以 下 查询 语句 找到 所 有 名 为 Sally 的 员工 : 
SELECT staffNo, ncome, position, salary 

FROM Staff 

WHERE name LIKE Sally $'，; 


结果 如 表 3-8 所 示 。 
表 3-8 查询 3.8 的 结果 表 











staffNo name position salary 
S0003 Sally Adams Assistant 30000 
S2250 Sally Stern Manager 48000 


GC 


注意 有 些 RDBMS (如 Microsoft Access) 用 通配符 “*” 和 “3?” 来 普 代 “名 ”和 “_”， 


查询 3.9 ”NULL 查询 条 件 (IS NULL / IS NOT NULL) 

列 出 没有 按期 归还 的 录像 

RentalAgreement 表 中 有 一 列 dateReturn 代 表 归 还 录像 的 日 期 。 也 许 你 会 认为 我 们 可 以 用 以 
下 查询 条 件 找 到 这 类 录像 : 

WHERE (dateReturn = '' OR dateReturn=0) 

但 是 ， 任 何 一 个 条 件 都 无 法 完成 以 上 工作 。 dateReturn 返 回 null 可 能 代表 一 个 未 知 值 ， 所 以 
我 们 无 法 测试 它 是 否 等 于 或 不 等 于 另 一 个 值 。 车 我 们 试图 用 该 复合 条 件 的 任何 一 个 条 件 执行 
SELECT 语句 ， 我 们 将 得 到 一 张 空 结果 表 。 我 们 需要 用 关键 词 IS NULL 来 显 式 地 测试 NULL。 


SELECT dateOut, memberNo, videoNo 
FROM RentalAgreement 
WHERE dateReturn IS NULL; 


结果 如 表 3-9 所 示 ， 否 定 版 本 (IS NOT NULL) 可 以 用 来 测试 不 是 空 值 的 列 ， 
表 3-9 查询 3.9 的 结果 表 
dateOut _ memberNo ‘videoNo 


2-Feb-03 M115656 178643 


3.2.3 给 结果 排序 


一 般 来 说 ，SQL 查 询 产生 的 结果 表 的 行 并 没有 按 任何 特定 的 要 求 排序 (尽管 有 些 DBMS 可 
能 使 用 一 个 默认 的 顺序 ， 例 如 ， 基 于 主键 的 排序 )。 但 是 ， 我 们 可 以 在 SELECT 语句 中 使 用 
ORDER BY 子 句 来 保证 一 个 查询 的 结果 被 排序 。ORDER BY 子 句 由 一 组 用 逗号 分 隔 的 要 在 结 
果 表 中 排序 的 列 名 组 成 。ORDER BY 子 句 允许 检索 得 到 的 行 基于 任 一 列 或 列 的 组 合 以 升序 
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(ASC) 或 降序 (DESC) 排列 ， 而 不 考虑 这 些 列 是 否 出 现在 结果 中 。 但 是 ，SQL 的 有 些 版 本 
坚持 ORDER BY 元 素 需 要 出 现在 SELECT 列表 中 。 但 不 管 是 娜 种 情况 ，ORDER BY 子 句 必 须 
是 SELECT 语句 的 最 后 一 个 子 句 。 

查询 3.10 ”给 结果 排序 

列 出 所 有 录像 ， 按 价格 降序 排列 

SELECT * 


FROM Video 
ORDER BY price DESC; 


该 查询 与 查询 3.1 类 似 ， 只 是 增加 了 将 结果 表 按 price 列 值 排序 的 条 件 。 这 通过 在 SELECT 
语句 的 末尾 加 上 ORDER BY 子 句 来 实现 ， 指 定 price 列 为 排序 的 列 ，DESC 表 明 以 降序 排列 。 
在 这 种 情况 下 ， 我 们 得 到 了 表 3-10 所 示 的 结果 。 

如 杂 我 们 得 到 多 个 price 列 值 相同 的 数据 ， 我 们 可 能 需要 将 结果 首先 以 price ( 主 排序 
键 ) 排序 ， 然 后 再 以 title (次 排序 键 ) 列 升序 排列 。 在 这 种 情况 下 ，ORDER BY 子 句 就 
变 成 : 


ORDER BY price DESC, title ASC; 


表 3-10 查询 3.10 的 结果 表 





catalogNo title category dailyRental Price directorNo 
634817 Independence Day Sci-Fi 4.50 32.99 D3765 
330553 Lord of the Rings Fantasy 5.00 31.99 D4576 
445624 Men In Black II Action 4.00 29.99 D5743 
207132 Die Another Day Action 5.00 21.99 D1001 
781132 Shrek Children 4.00 18.50 D0078 
902355 Harry Potter Children 4.50 14.50 D7834 





3.2.4 使 用 SQL 的 聚合 函数 


ISO 标准 定义 了 五 个 聚合 函数 : 
返回 指定 列 的 值 的 个 数 
返回 指定 列 的 值 的 总 和 
返回 指定 列 的 平均 值 


返回 指定 列 的 最 小 值 
返回 指定 列 的 最 大 值 

这 些 函 数 在 表 中 的 一 个 列 上 操作 ， 并 且 返 回 单一 值 。COUNT、MIN 和 MAX 可 以 用 到 数值 
和 非 数 值 型 字段 上 ， 但 SUM 和 AVG 只 能 用 到 数值 型 字段 上 。 除 了 COUNT(*) 以 外 ， 每 个 函数 
都 首先 忽略 NULL 值 ， 然 后 再 对 剩 下 的 非 空 值 进行 操作 。COUNT(*) 是 COUNT 的 特殊 用 法 ， 
它 统计 表 中 的 所 有 行 ， 不 管 这 些 行 是 否 是 空 值 或 是 出 现 重复 值 。 

如 果 希 望 在 应 用 函数 之 前 先 去 掉 重 复 列 ， 可 以 在 函数 中 的 列 名 前 加 上 关键 字 DISTINCT 
DISTINCT 对 于 MIN 和 MAX 函 数 来 说 没有 作用 。 但 是 ， 对 于 SUM 和 AVG 的 结果 会 有 所 影响 ， 
所 以 ， 是 否 需要 在 计算 中 包括 或 排除 重复 值 需要 仔细 考虑 。 另 外 ， 在 一 个 查询 中 DISTINCT 只 
能 指定 一 次 。 
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要 特别 注意 的 是 ， 聚 合 函数 只 能 在 SELECT 列表 和 HAVING 子 向 中 使 用 。 在 任何 别 的 
地 方 使 用 都 是 不 正确 的 。 如 果 SELECT 列 表 中 包含 了 聚合 函数 并 且 没 有 使 用 GROUP 
BY 子 句 ， 那 么 SELECT 列表 中 的 项 不 能 包含 对 任何 列 的 引用 ， 除非 该 列 是 聚会 济 数 
的 参数 。 例 如 ， 以 下 查询 是 不 合法 的 : 

SELECT staffNo, COUNT (salary) 

FROM Staff; 

因为 这 个 查询 没有 GROUP BY 子 身 ， 并 且 SELECT 列 表 中 的 staffNo 列 在 聚合 函数 之 
外 使 用 。 


查询 3.11 使 用 COUNT 和 SUM 

列 出 年 薪 高 于 $40000 的 员工 总 数 和 他 们 的 年 薪 总 和 

SELECT COUNT (staffNo) AS totalStaff ，8SUM(salary)AS totalSalary 

FROM Staff 

WHERE salary>40000; 

该 查询 的 WHERE 子 句 和 查询 3.5 类 似 ， 但 是 ， 表 3-11 查询 3.11 的 结果 表 
在 这 里 我 们 用 COUNT 函 数 来 计算 满足 WHERE 子 
名 的 行 数 ， 用 SUM 国 数 来 计算 这 些 行 的 年 薪 总 和 。 7 000 
结果 表 如 表 3-11 所 示 。 

查询 3.12 使 用 MIN、MAX 和 AVG 

列 出 员工 年 薪 的 最 小 值 、 最 大 值 和 平均 值 


SELECT MIN(salary) AS minSalary, MAX(salary) AS maxSalary, 
AVG(salary) AS avgsalary 


FROM Staff; 表 3-12 查询 3.12 的 结果 表 

在 该 查询 中 ， 我 们 需要 考虑 所 有 员工 的 数据 ， 
所 以 不 需要 WHERE 子 句 。 要 求 的 值 可 以 通过 使 
用 MIN、MAX 和 AVG 函 数 来 计算 。 该 查询 的 结果 
如 表 3-12 所 示 。 


3.2.5 对 结果 分 组 


前 面 的 查询 相当 于 一 篇 报告 最 后 的 总 结 ， 它 们 将 报告 中 所 有 的 细节 数据 浓缩 成 了 一 行 概 
要 数据 。 但 是 ， 在 报告 中 往往 还 需要 小 计 。 我 们 可 以 使 用 SELECT 语句 中 的 GROUP BY 子 句 
来 进行 小 计 。 一 个 包含 了 GROUP BY 子 句 的 查询 被 称 为 分 组 查询 ， 因 为 它 将 SELECT 表 中 的 
数据 进行 分 组 并 为 每 个 分 组 产生 了 一 个 概要 行 。 在 GROUP BY 子 句 中 的 列 被 称 为 分 组 列 。ISO 
标准 要 求 SELECT 子 句 和 GROUP BY 子 句 紧密 结合 在 一 起 。 当 使 用 了 GROUP BY 子 句 后 ， 
SELECT 列表 中 的 每 一 项 在 每 个 分 组 中 必须 都 是 单 值 的 。 而 且 ，SELECT 子 名 只 能 包含 : 

。 列 名 。 





totalStaff totalSalary 


minSalary maxSalary avgSalary 


30000 50000 41166.67 


。 一 个 包含 上 述 各 项 组 合 的 表达 式 。 
在 SELECT 列表 中 的 所 有 列 名 都 必须 出 现在 GROUP BY 子 句 中 ， 除 非 该 名 称 只 在 聚合 函数 中 使 
用 。 反 之 则 不 然 ， 在 GROUP BY 子 句 中 出 现 的 列 名 则 不 一 定 出 现在 SELECT 列 表 中 。 当 WHERE 子 句 
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和 GROUP BY 子 句 同时 使 用 时 ，WHERE 子 句 先 被 应 用 ， 然 后 在 剩 下 的 满足 条 件 的 行 之 上 进行 分 组 。 


ISO 标准 在 使 用 GROUP BY 时 认为 两 个 空 值 相等 。 如 果 两 行 在 相同 的 分 组 列 上 都 是 空 
值 ， 而 且 在 其 他 非 空 分 组 列 上 值 都 相同 ， 就 将 它们 归 入 同一 分 组 中 。 





查询 3.13 使 用 GROUP BY 

找 出 每 个 分 公司 的 员工 总 数 和 他 们 的 年 薪 总 和 

SELECT branchNo, COUNT (staffNo) AS totalStaff 
SUM(salary) AS totalSalary 

FROM Stciff 

GROUP BY branchNo 

ORDER BY branchNo; 


没有 必要 在 GROUP BY 列表 中 包含 staffNo 和 salary 列 名 ， 因 为 它们 只 在 SELECT 列 表 中 的 
聚合 函数 中 出 现 。 另 外 ，branchNo 与 聚合 函数 没有 关联 ， 所 以 必须 在 GROUP BY 列表 中 出 现 。 
结果 如 表 3-13 所 示 。 

表 3-13 ”查询 3.13 的 结果 表 


branchNo totalStaff totalSalary 
B001 2 76000 
” B002 2 82000 
B003 . 1 41000 
B004 ] 48000 


在 概念 上 ，SQL 按 如 下 说 明 完 成 该 查询 。 
1) SQL 根据 员工 的 分 公司 号 对 员工 进行 分 组 。 在 每 个 组 中 ， 所 有 的 员工 有 相同 的 分 公司 
号 。 在 该 例子 中 ， 我 们 将 得 到 四 个 分 组 。 


COUNT(staffNo) | SUM(saiary) 





2) 针对 每 个 组 ，SQL 计 算 员工 的 数目 ， 并 计算 salary 列 值 的 总 和 来 得 到 年 薪 总 和 。SQL 在 
查询 结果 中 为 每 个 组 产生 一 个 概要 行 。 

3) 最 后 ， 结 果 将 结果 按 分 公司 号 (branchNo) 升序 排列 。 

有 限制 的 分 组 (HAVING 子 名) 

HAVING 子 句 和 GROUP BY 子 句 同时 作用 来 限制 在 结果 表 中 出 现 的 分 组 。 尽 管 HAVING 
和 WHERE 子 句 在 语法 上 相似 ， 但 是 它们 的 目的 不 同 。WHERBE 子 句 过 滤 进 入 结果 表 的 单个 
行 ， 而 HAVING 子 旬 将 过 滤 进 入 结果 表 的 整个 分 组 。 ISO 标准 要 求 在 HAVING 子 句 中 使 用 的 
列 名 必须 在 GROUP BY 列表 中 出 现 ， 或 者 被 包含 在 聚合 函数 中 。 事 实 上 ，HAVING 子 旬 的 查 
询 条 件 常常 至 少 包含 一 个 聚合 函数 ， 否 则 查询 条 件 就 可 以 移 到 WHERE 子 句 并 应 用 到 单行 中 。 
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(切记 聚合 国 数 不 可 在 WHERE 子 句 中 使 用 。 ) 

HAVING 子 句 不 是 SQL 的 必要 部 分 一 一 任何 用 HAVING 子 句 描述 的 查询 都 可 以 用 不 包含 
HAVING 子 句 的 语句 来 代替 。 

查询 3.14 使 用 HAVING 

对 每 个 分 公司 ， 如 果 有 多 名 员工 ， 则 找 出 这 些 分 公司 的 员工 数 和 工资 总 额 

SELECT branchNo, COUNT(staffNo) AS totalStaff, 

SUM (salary) AS totalSalary 

FROM Staff 

GROUP BY branchNo 

HAVING COUNT (staffNo) > 1 

ORDER BY branchNo; 表 3-14 查询 3.14 结 果农 

这 和 前 面 的 例子 有 相似 之 处 ， 只 是 增加 了 限制 





条 件 : 我 们 需要 考虑 那些 员 工 数 多 于 一 个 人 的 分 组 branchNo totalStaff totalSalary 
(分 公司 ) 。 这 个 限制 应 用 到 分 组 中 ， 所 以 用 了 S002 2 0000 
HAVING 子 句 。 结 果 如 表 3-14 所 示 。 

3.2.6 子 查 询 


在 这 一 节 中 ， 我 们 将 考虑 一 个 做 入 到 另 一 个 SELECT 语 句 中 的 完整 的 SELECT 语 句 。 内 层 
的 SELECT 语 句 ( 称 为 子 查 询 ) 的 结果 被 用 在 外 层 的 SELECT 语句 中 ， 帮 助 决 定 结果 的 内 容 。 
一 个 子 查询 可 以 用 在 外 层 SELECT 语 句 的 WHERE 和 HAVING 子 句 中 ， 被 称 为 子 查询 或 途 套 查 
询 。 子 查询 也 可 出 现在 INSERT、UPDATE 和 DELETE 语 名 中 。 

查询 3.15 使 用 子 查 询 

找 出 在 位 于 “8 Jefferson Way” 的 分 公司 工作 的 员工 

SELECT staffNo, name, position : 

FROM Staff 

WHERE branchNo = (SELECT branchNo 

FROM Branch 
WHERE street= '8 Jefferson Way'); 

内 层 的 SELECT 语 句 (SELECT branchNo FROM Branch …… ) 查找 出 在 街道 “8 
Jefferson Way” 的 分 公司 的 分 公司 号 (结果 将 只 有 一 个 分 公司 号 )， 得 到 该 分 公司 号 后 ， 外 层 
SELECT 语句 将 检索 出 在 该 分 公司 工作 的 所 有 员工 的 详细 信息 ， 也 就 是 说 ， 内 层 的 SELECT 返 
回 的 结果 表 只 包含 值 “B001”， 对 应 于 位 于 “8 Jefferson Way” 的 分 公司 。 外 层 的 SELECT 语 


名 就 变 成 了 : 
SELECT staffNo, name, position 
FROM Staff 
WHERE branchNo = 'B0OO01'， 


此 查询 的 结果 表 如 表 3-15 所 示 。 
表 3-15 查询 3.15 结 果 表 





staffNo name position 





S1500 Tom Daniels Manager 
S0003 Sally Adams Assistant 
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我 们 可 以 把 子 查 询 看 作 是 生成 一 个 临时 表 ， 临 时 表 的 结果 可 以 被 外 层 语 句 存 取 和 使 用 。 
子 查询 可 以 直接 在 WHERE 或 HAVING 子 名 的 关系 运算 符 (如 ，=、<、>、<=、>=、<>) 的 后 
面 使 用 。 子 查询 常常 被 写 在 圆 括号 内 。 


注意 ， 如 果 内 层 查询 的 结果 有 多 行 ， 那 么 我 们 必须 使 用 集合 成 员 测 试 IN 而 不 是 等 于 
测试 (“=”)。 上 比如， 如 果 我 们 希望 找到 在 华 感 顿 (W A) 的 分 公司 工作 的 所 有 员工 ， 


WHERE 子 身 就 应 该 变 为 : 
WHERE branchNo IN ( SELECT branchNo FROM Branch 
WHERE state= WA');: 


查询 3.16 使 用 包含 聚合 函数 的 子 查询 

列 出 年 薪 高 于 平均 年 薪 的 所 有 员工 

SELECT staffNo, name, position 

FROM Staff 

WHERE salary > (SELECT AVG (salary) 
FROM Staff); 


回顾 我 们 在 3.2.4 节 中 讲 到 的 ， 训 合 了 负数 只 能 用 在 SELECT 列 表 和 HAVING 子 句 中 。 所 以 写 
“WHERE salary > AVG(salary)” 这 样 的 语句 是 不 正确 的 。 我 们 需要 使 用 子 查询 找 出 平均 年 薪 ， 
然后 使 用 外 层 SELECT 语句 来 找 出 所 有 年 薪 高 于 平均 年 薪 的 员工 。 换 名 话说 ， 子 查询 返回 平均 
年 薪 $41166.67， 外 层 查询 就 可 以 写 为 : 

SELECT staffNo, name, position 


FROM Staff 
WHERE salary > 41166.67; 


结果 如 表 3-16 所 示 。 





表 3-16 查询 3.1 结 果 表 








staffNo name position 
S1500 | Tom Daniels Manager 
S0010 Mary Martinez Manager 
” S2250 Sally Stern Manager 


注意 应 用 在 子 查询 中 的 下 述 规 则 : 

1) ORDER BY 子 抽 不 能 用 在 子 查 询 中 ， 尽 管 管 最 外 层 SELECT 语 负 可 能 会 使 用 该 子 铅 。 
2) 子 查询 SELECT 列表 必须 由 一 列 列 名 或 是 一 个 表达 式 组 成 ， 除非 子 查询 使 用 关键 
字 EXISTS 一 一 见 2002 年 Connolly 和 Begg 合 作出 版 的 书 。 

3) 菊 认 时 ， 子 查询 中 的 列 名 是 子 查询 FROM 子 铅 中 的 表 中 存在 的 列 名 ， 通过 限定 列 
名 也 可 以 引用 外 层 查询 的 FROM 子 负 中 的 表 ， 


4) 当 子 查询 是 比较 运算 中 涉及 的 两 个 操作 数 中 的 一 个 时 ， 子 查询 必须 出 现在 比较 操 
作 符 的 右 侧 。 例 如 ， 最 后 的 例子 如 果 写 成 下 面 的 形式 就 是 不 正确 的 。 


SELECT staffNo, name, position 
FROM Staff 
WHERE (SELECT AVG(salary) FROM Staff) < salary; 


因为 在 上 述 表 达 中 ， 子 查询 出 现在 了 比较 表达 式 的 左 侧 。 
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3.2.7 多 表 查 询 


到 目前 为 止 ， 我 们 所 考虑 的 例子 都 有 一 个 限制 : 在 结果 表 中 出 现 的 列 都 来 自 一 个 表 。 但 
在 很 多 情况 下 结果 表 中 的 列 不 可 能 只 来 自 一 个 表 。 为 了 将 几 个 表 中 的 列 都 加 入 到 结果 表 中 ， 
我 们 需要 使 用 连接 (join) 操作 。SQL 的 连接 操作 通过 两 表 之 间 的 相关 行将 来 自 两 个 表 中 的 信 
息 组 合 起 来 。 这 个 联接 表 中 的 相关 行 对 是 两 个 表 中 匹配 的 列 具 有 相同 值 的 行 。 

如 果 需 要 得 到 来 自 多 个 表 的 信息 ， 就 可 以 选择 使 用 子 查 询 或 是 连接 操作 。 如 果 希 望 在 最 
终 的 结果 表 中 得 到 来 自 不 同 表 的 列 ， 那 么 必须 使 用 连接 操作 。 要 执行 连接 操作 ， 仅 需 在 
FROM 子 句 中 加 上 多 个 表 名 ， 用 逗号 隔 开 ， 并 在 WHERE 子 句 中 指定 要 连接 的 列 。 而 且 可 以 在 
FROM 子 句 中 使 用 表 的 别名 。 在 这 种 情况 下 ， 别 名 可 以 跟 在 表 名 后 面 用 一 个 空格 隔 开 。 在 列 
名 不 明确 的 情况 下 ， 别 名 可 以 用 来 指定 列 名 的 出 处 ， 它 也 可 以 作为 表 名 的 一 个 简称 。 一 旦 为 
表 取 了 别名 后 ， 别 名 可 以 出 现在 任何 可 以 出 现 表 名 的 地 方 ， 作 为 表 名 的 替换 。 
查询 3.17 简单 连接 
列 出 所 有 录像 及 它们 的 导演 
SELECT catalogNo, title, category, v.directorNo, directorName 


FROM Video v, Director G 
WHERE v.directorNo = Ad.directorNo; 


我 们 需要 从 Video 表 和 Director 表 中 获得 详细 信息 ， 所 以 我 们 需要 使 用 连接 操作 。SELECT 
子 句 列 出 了 需要 显示 的 列 。 为 了 得 到 需要 的 行 ， 我 们 使 用 查询 条 件 vdirectorNo = d.directorNo 
来 得 到 两 个 表 中 directorNo 列 值 相同 的 行 。 我 们 将 这 两 列 称 为 两 表 的 匹配 列 。 结 果 表 如 表 
3-17 所 示 。 








注意 ， 在 SELECT 列 表 中 限制 导演 号 directorNo 是 必要 的 。 因 为 directorNo 可 以 来 自 于 
任何 一 张 表 ， 所 以 我 们 需要 指定 显示 的 是 哪 一 个 表 。( 我 们 也 可 以 选择 Director 表 中 
的 directorNo 列 。) 该 限制 通过 在 列 名 前 加 一 个 相应 表 名 (或 者 别名 ) 作为 前 级 。 在 
这 个 例子 里 ， 我 们 使 用 Video 表 的 别名 v 作 为 前 缓 。 







表 3-17 查询 3.17 结 果 表 








catalogNo title category v.directorNo directorName 
207132 Die Another Day Action D1001 Lee Tamahori 
902355 Harry Potter Children D7834 Chris Columbus 
330553 Lord of the Rings Fantasy D4576 Peter Jackson 
781132 Shrek Children D0078 Andrew Adamson 
445624 Men In Black II Action D5743 Barry Sonnenfeld 
634817 Independence Day Sci-Fi D3765 Roland Emmerick 





最 常见 的 多 表 查 询 是 有 一 对 多 关系 的 两 个 表 。 前 面 的 涉及 录像 和 导演 的 查询 就 是 这 样 的 
一 个 例子 。 任 何 一 个 导演 可 以 导演 一 部 或 多 部 电影 。 在 2.2.5 节 中 ， 我 们 讲述 了 在 关系 数据 库 
中 如 何 描述 候选 键 和 外 键 关 系 的 知识 。 要 在 SQL 查询 中 使 用 关系 ， 我 们 通过 将 候选 键 之 一 
(通常 是 主键 ) 和 相应 的 外 键 进行 比较 来 指定 查询 条 件 。 在 查询 3.16 中 ， 我 们 将 Video 表 中 的 
外 键 v. directorNo 和 Director 表 中 的 主键 d. directorNo 进 行 比较 。 

SQL 标准 是 用 下 面 的 替代 方法 来 指定 连接 条 件 : 
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一 一 一” ”~ 


FROM Video v JOIN Director d ON v. directorNo = d. directorNo; 
FROM Video JOIN Director USING directorNo; 
FROM Video NATURAL JOIN Director; 


在 任何 一 种 情况 下 ， 都 是 用 FROM 子 句 赫 代 原 先 的 FROM 和 WHERE 子 句 。 然 而 ， 第 一 种 
替代 方案 产生 了 一 张 有 两 个 相同 directorNo 列 的 表 ， 而 剩 下 的 两 种 方案 将 产生 只 包含 一 个 
directorNo 列 的 表 。 

查询 3.18 四 表 连 接 

列 出 所 有 录像 以 及 它们 的 导演 、 演 员 名 单 和 相应 的 角色 

SELECT Vv.catalogNo, title, category, directorName, actorName, character 

FROM Video v, Director d, Actor a, Role r 

WHERE d.directorNo = v.directorNo AND 


VvV.catalogNo = r.catalogNo AND 


r.actorNo = a.actorNo; 

在 这 个 例子 中 ， 我 们 想 要 显示 来 自 Video、Director、Actor 和 Role 表 中 的 详细 信息 ， 所 以 
我 们 使 用 连接 操作 。SELECT 子 旬 列 出 了 要 显示 的 列 。 为 了 得 到 需要 的 行 ， 我 们 应 该 基于 各 种 
匹配 列 ( 即 主键 /外 键 ) 来 连接 表 ， 如 下 所 示 : 

Director (directorNo, directorName) 


Video (catalogNo, title, category, dailyRental, price, directorNo) 
Role (actorNo, catalogNo, character) 


Actor (actorNo, actorName) 


结果 表 如 表 3-18 所 示 。 
表 3-18 查询 3.18 结 果 表 


catalogNo title category directorName actorName character 
。 207132 Die Another Day Action Lee Tamahori Pierce Brosnan James Bond 
902355 Harry Potter Children Chris Columbus Daniel Radcliffe Harry Potter 
330553 Lord of the Rings Fantasy Peter Jackson Elijah Wood Frodo Baggins 
781132 Shrek Children Andrew Adamson Mike Myers Shrek 
445624 Men In Black II Action Barry Sonnenfeld Will Smith AgentJ 
445624 Men In Black II Action Barry Sonnenfeld Tommy Lee Jones Agent K 
634817 Independence Day Sci-Fi Roland Emmerick Will Smith Captain Steve Hiller 


3.2.8 INSERT、UPDATE 和 DELETE 语 名 


SQL 是 一 种 完整 的 数据 操纵 语言 ， 我 们 可 以 用 它 来 查询 数据 库 ， 也 可 以 用 它 来 修改 数据 
库 中 的 数据 。 修 改 数据 库 的 命令 不 像 SELECT 语 句 那 样 复杂 。 在 这 一 节 中 ， 我们 将 详细 介绍 
SQL 的 三 种 用 来 修改 数据 库 中 表 内 容 的 语句 。 

*INSERT 向 表 中 插入 新 的 数据 。 

。UPDATE 修改 表 中 的 数据 。 
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*DELETE 从 表 中 删除 数据 行 。 

1. 插入 语句 (INSERT 语句 ) 
INSERT 语 句 的 一 般 格 式 为 : 

INSERT INTO TableName [ (columnList)] 
VALUES (dataValueList) 


TableName 是 基本 表 的 表 名 ，columnList 代 表 一 组 由 到 号 分 隔 的 一 个 或 多 个 列 名 。 
columnList 是 可 选 的 ， 如 果 省 略 它 ，SQL 将 假定 所 有 列 按照 它们 在 建 表 (CREATE TABLE) 
定义 的 顺序 排列 。 如 果 指 定 了 columnList， 那 么 所 有 在 列表 中 省 略 了 的 列 必须 在 表 创 建 时 被 指 
定 为 可 以 为 空 ， 除 非 在 创建 表 时 指明 该 列 可 以 使 用 软 认 值 DEFAULT ( 见 3.3.1 池 )， 
dataValueList 必 须 按 下 列 规则 与 columnList 匹 配 : 

。 两 个 列表 中 的 项 数 必须 一 样 。 

* 在 两 个 列表 中 ， 各 项 的 位 置 必须 直接 对 应 ， 因 此 dataValueList 中 的 第 一 项 将 用 在 columnList 

的 第 一 项 中 ，dataValueList 中 的 第 二 项 将 用 在 columnList 的 第 二 项 中 ， 以 此 类 推 。 

* dataValueList 中 每 一 项 的 数据 类 型 必须 与 相应 的 列 的 数据 类 型 兼容 。 

查询 3.19 向 表 中 播 入 一 行 

向 Video 表 中 插入 一 行 


INSERT INTO Video 
VALUES {({'207132', 'Die Another Day '， ‘Action', 5.00, 21.99, 'D1001'); 


在 这 个 特殊 的 例子 中 ， 我 们 按照 创建 表 时 指定 的 列 的 顺序 为 所 有 列 提供 了 列 值 。 因 此 ， 
， 我 们 可 以 省 略 列 名 列表 。 

2. 更 新 语句 (UPDATE 语 向 ) 

UPDATE 语 旬 的 一 般 格式 为 : 

UPDATE TableName 


SET columnNamel = dataVvaluel [， columnName2 = dataValue2...] 
[WHERE searchCondition)] 


SET 子 句 指明 需要 更 新 的 一 个 列 或 多 个 列 的 列 名 ， WHERE 子 句 是 可 选 的 ， 如 果 省 略 
WHERE 子 句 ， 则 将 修改 表 中 指定 列 的 所 有 行 数据 。 如 果 指 定 了 WHERE 子 句 ， 则 只 有 那些 满 
足 searchCondition 的 行 才 被 更 新 。 

查询 3.20 ”更 新 表 中 行 

将 “Thriller” 类 的 录像 的 日 租金 提高 10% 


UPDATE Video 
SET GailyRental = dailyRental * 1.1 
WHERE action = ‘Thriller'; 


3. 删除 语 向 (DELETE 语 向 ) 
DELETE 语 句 的 一 般 格 式 为 : 
DELETE FROM TableName 
[WHERE searchCondition] 


同 UPDATE 语 句 一 样 ， WHERE 子 句 也 是 可 选 的 ， 如 果 省 略 WHERE 子 句 ， 则 表 中 所 有 
的 行 都 将 被 删除 。 如 果 指 定 了 WHERE 子 句 ， 那么 只 有 符合 searchCondition 的 行 才 会 被 删 
除 。 





莫 3 苹 SOL 和 OBEF 41 


查询 3.21 从 表 中 删除 行 
删除 类 别 号 为 634817 的 出 租 录 像 


DELETE FROM VideoForRent 
WHERE catalogNo=' 634817.'，; 
局 
3.3 数据 定义 


在 这 一 节 中 ， 我 们 主要 介绍 两 种 SQL DDL 语 句 ， 即 : 
* 创建 表 语 句 (CREATE TABLE) 在 数据 库 中 创建 一 张 新 表 。 
* 创建 视图 语句 (CREATE VIEW) 从 基本 表 创 建 一 个 新 的 视图 。 


3.3.1 创建 表 


CREATE TABLE TableName 

{ ( columnName dataType [NOT NULL] [UNIQUE1] 

[DEFAULT defaultOption]} [, ....] } 

(PRIMARY KEY (listOfColumns), |] 

{[UNIQUE (listOfColumns}),] [, ... ]} 

{ [FOREIGN KEY (listOfForeignKeyColumns) 

REFERENCES ParentTableName [(listOfCandidateKeyColumns)], 
[ [ON UPDATE referentialAction] 
[ON DELETE refentialAction]}] [, ...] } ) 


CREATE TABLE 语 句 的 完整 版 本 非常 复杂 ， 在 这 一 节 中 我 们 给 出 该 语句 的 简化 的 版 本 ， 
以 便 说 明 该 语句 的 主要 部 分 。 图 3-1 显 示 了 创建 Branch、 Director 和 Video 三 张 表 的 CREATE 
TABLE 语 句 。 每 个 语句 首先 定义 表 中 的 每 个 列 ， 然 后 加 上 一 个 或 两 个 其 他 子 句 : 一 个 子 名 用 
于 定义 主键 ， 另 一 个 子 句 用 于 定义 外 键 。 
1. 定义 列 
定义 表 中 一 个 列 的 基本 格式 如 下 : 
columnName dataType [NOT NULL] [UNIQUE] {DEFAULT defaultOption] 
columnName 即 要 定义 的 列 的 列 名 ，dataType 定 义 列 的 类 型 。 ISO 标准 支持 表 3-19 所 示 的 数 
据 类 型 。 最 常用 的 数据 类 型 如 下 : 
“CHARACTER(GL): 通常 简写 为 CHAR， 定 义 一 个 长 度 固定 为 L 的 字符 串 。 如 果 输 入 的 字 
符 串 中 字符 个 数 少 于 这 个 长 度 ， 则 将 在 该 字符 串 后 面 补 空格 使 其 符合 要 求 的 长 度 。 
* CHARACTER VARYING(L): 通常 简写 为 VARCHAR， 定义 一 个 可 变 长 度 的 字符 串 (最 
大 长 度 为 L)。 如 果 输 入 字符 串 的 字符 个 数 少 于 该 长 度 ， 则 只 存储 输入 的 那些 字符 ， 所 以 
需要 较 少 空间 。 | 
* DECIMAL(precision, [scale]) 或 者 NUMERIC(precision，[scale]): 定义 一 个 精确 表示 的 数 
字 。precision 指 定数 字 位 数 ， scale 指 定 小 数 点 后 的 数字 位 数 。 这 两 者 的 差别 是 ， 
NUMERIC 必 须 提供 指定 的 精度 ， 而 DECIMAL 可 以 提供 大 于 等 于 所 要 求 的 精度 。 例 如 ， 
PECIMAL(4) 可 以 代表 从 - 9999 到 +9999 的 数字 ，DECIMAL(4,2) 可 以 代表 从 - 99.99 到 
+99.99 的 数字 。 
“INIEGER 和 SMALLINT: 定义 不 需要 分 数 的 数字 ， 一 般 SMALLINT 可 以 用 来 存储 绝对 
值 最 大 为 32767 的 数 。 
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CREATE TABLE Branch (branchNo CHAR(4) NOT NULL, 
street VARCHAR(30) NOT NULL, 
city VARCHAR(20) NOT NULL, 
state CHAR(2) NOT NULL, 
zipCode CHAR(5) NOT NULL UNIQUE， 
mgrStaffNo CHAR(S) NOT NULL, 
CONSTRAINT pk1 PRIMARY KEY (branchNo), 
CONSTRAINT fk1 FOREIGN KEY (mgrStaffNo) REFERENCES Staff 
ON UPDATE CASCADE ON DELETE NO ACTION); 
CREATE TABLE Director (directorNo CHAR(S) NOT NULL, 
directorName VARCHAR(30) NOT NULL, 
CONSTRAINT pk2 PRIMARY KEY (directorNo)); 
CREATE TABLE Video (catalogNo CHAR(6) NOT NULL, 
title VARCHAR(40) NOT NULL, 
category VARCHAR(10) NOT NULL, 
dailyRentai DECIMAL(4, 2) “NOT NULL DEFAULT 5.00, 
Price DECIMAL(4, 2), 
directorNo CHAR(S) NOT NULL, 
CONSTRAINT pk3 PRIMARY KEY (catalogNo), 
CONSTRAINT fk2 FOREIGN KEY (directorNo) REFERENCES Director 
ON UPDATE CASCADE ON DELETE NO ACTION); 





图 3-1 创建 Branch、Director 和 Video 表 的 CREATE TABLE 语 句 


* DATE: 存储 公历 格式 的 日 期 ， 是 年 (4 位 数 )、 月 (2 位 数 )、 日 (2 位 数 ) 的 组 合 。 

另外 ， 还 可 以 定义 : 

* 该 列 是 否 不 允许 为 空 (NOT NULL )。 

“是 否 该 列 的 每 个 值 都 是 唯一 的 ， 即 该 列 是 否 是 一 个 候选 键 (UNIQUE )。 

* 为 该 列 指定 一 个 默认 值 ， 当 没有 为 该 列 指定 新 值 时 ， 将 用 默认 值 代 替 (DEFAULT )。 

ISO 标准 的 完全 版 本 也 人 允许 指定 其 他 的 条 件 ， 有 兴趣 的 读者 可 以 参考 2002 年 Connolly 和 
Begg 合 作出 版 的 书 来 获得 更 详细 的 信息 。 

表 3-19 1SO SQL 数据 类 型 


一 一 
数据 类 型 声明 





boolean BOOLEAN 

character CHAR， VARCHAR 

bit BIT, BIT VARYING 

exact numeric NUMERIC， DECIMAL， INTEGER, SMALLINT 
approximate numeric FLOAT, REAL, DOUBLE PRECISION 

datetime DATE, TIME, TIMESTAMP 

interval INTERVAL 


large objects CHARACTER LARGE OBJECT BINARY LARGE OBJECT 
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2. 主键 子 向 和 实体 完整 性 

一 个 表 的 主键 必须 包含 对 每 一 行 都 唯一 、 非 空 的 值 。ISO 标 准 用 CREATE TABLE 语 名 中 
的 PRIMARY KEY 子 名 来 支持 实体 完整 性 。 比 如 ， 我 们 可 以 用 如 下 语句 定义 Video 和 Role 表 的 
主键 ，Roie 表 的 主键 是 组 合 键 。 


CONSTRAINT PK PRIMARY KEY (catalogNo) 
CONSTRAINT PK1 PRIMARY KEY (catalogNo, actorNo) 


广 意 ， 关 键 字 CONSTRAINT 后 面 跟随 的 约束 名 是 可 选 的 ， 而 且 允 许 使 用 SQL 语 名 ALTER 
TABLE 来 删除 约束 。 
3. 外 键 子 向 和 参照 完整 性 
ISO 标准 用 CREATE TABLE 语 名 中 的 FOREIGN KEY 子 句 来 定义 外 键 。 ISO 标 准 通过 限制 
子 表 的 INSERT 和 UPDATE 操 作 实现 参照 完整 性 ， 这 些 操作 试图 在 子 表 中 创建 和 父 表 中 的 候选 
键 不 相 匹 配 的 外 键 值 。 如 果 是 更 新 或 删除 父 表 中 的 和 子 表 有 匹配 行 的 候选 键 值 的 UPDATE 和 
DELETE 操 作 ， 那 么 SQL 通 过 在 FOREIGN KEY 子 句 中 使 用 ON UPDATE 和 ON DELETE 子 操作 
来 实现 引用 操作 。 
"CASECADE: 当 从 父 表 更 新 或 删除 行 时 ， 对 子 表 中 匹配 的 行 也 要 作 相应 的 更 新 或 删除 。 
因为 这 些 被 更 新 或 删除 的 行 可 能 还 包含 候选 键 (这 些 候选 键 又 作为 另 一 张 表 的 外 键 )， 
所 以 另外 一 些 表 的 外 键 规则 又 将 被 触发 ， 所 以 称 为 级 联 方 式 。 
“SET NULL: 当 从 父 表 更 新 或 删除 行 时 ， 将 子 表 中 的 外 键 值 置 为 NULL 。 这 只 有 当 外 键 
列 没 有 特别 指定 是 非 空 (NOT NULL) 时 才 有 效 。 
“SET DEFAULT: 当 从 父 表 更 新 或 删除 行 时 ， 将 子 表 中 外 键 的 每 个 成 员 都 置 为 一 个 指定 
的 默认 值 。 这 只 有 当 外 键 列 具有 一 个 指定 的 默认 值 时 才 有 效 。 
“NO ACTION: 拒绝 父 表 中 的 更 新 或 删除 操作 。 这 是 一 种 默认 的 方式 ， 如 果 没 有 指明 ON 
UPDATE 或 ON DELETE 规 则 就 采用 这 种 方式 。 


3.3.2 建立 视图 
建立 视图 的 (简化 的 ) 语句 格式 如 下 : 


CREATE VIEW ViewName [ (newColumnName [, ... ] ) 】 

AS subselect 

视图 通过 指定 一 个 SQL SELECT 语句 (被 称 为 “定义 查询 ”) 来 定义 。 可 以 为 视图 中 的 
每 列 指定 一 个 名 字 。 如 果 指 定 了 列 名 列表 ， 则 它 的 列 名 列表 包含 的 列 的 数目 必须 同 子 查询 产 . 
生 的 列 数 相同 。 若 省 略 了 列 名 列表 ， 则 视图 中 的 每 一 个 列 名 都 与 子 查询 语句 中 的 相应 列 名 相 
同 。 如 果 列 名 有 歧义 ， 则 必须 指定 列 名 列表 。 当 在 子 查询 中 包含 计算 产生 的 列 而 没有 用 AS 
子 句 来 为 该 列 指定 名 称 时 ， 或 者 当 连 接 操作 后 结果 中 出 现 了 两 个 同名 的 列 时 ， 都 会 出 现 这 种 
情况 。 
例如 ， 我 们 需要 得 到 B001 分 公司 的 所 有 员工 的 不 包含 年 薪 信息 的 信息 ， 则 可 以 建立 如 下 
视图 : 

CREATE VIEW StaffBranch1l ， 

AS SELECT staffNo, name, position 


FROM Staff 
WHERE branchNo = ‘B001.'，; 
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3.4 QBE 


QBE 是 另 一 种 基于 图 形 的 采用 点 击 方法 查询 数据 库 的 方法 。QBE 被 誉 为 非 专 业 用 户 从 数 
据 库 中 得 到 信息 的 最 便捷 的 方法 之 一 。QBE 使 用 模板 为 查询 数据 提供 了 一 种 可 视 化 工具 ， 查 
询 数 据 库 通过 解释 要 回答 的 查询 得 到 ， 它 通过 显示 器 屏幕 而 不 是 键入 SQL 语 句 来 实现 。 但 是 ， 
你 必须 指明 你 希望 查看 的 列 (在 Microsoft Access 称 为 字段 )， 并 指定 你 希望 用 来 限制 查询 的 数 
据 值 。QBE 这 样 的 语言 是 一 个 交互 地 查询 和 更 新 数据 库 的 高 效 方法 。 

和 SQL 类 似 ，QBE 也 是 在 IBM 中 开发 出 来 的 (事实 上 ，QBE 是 IBM 的 商标 )， 但 是 一 系列 
包括 微软 在 内 的 开发 商 也 在 销售 类 似 QBE 的 界面 。 开 发 商 通常 提供 SQL 和 QBE 两 种 工具 ， 使 
用 QBE 服 务 为 简单 查询 提供 更 直观 的 交互 界面 ， 同 时 又 具备 SQL 能 够 处 理 复杂 查询 的 能 力 。 

读 完 本 节 后 ， 你 将 发 现 QBE 的 查询 版 本 常常 更 加 直观 。 为 了 说 明 ， 我们 使 用 Microsoft 
Access 2002 工 具 ， 并 且 在 每 个 例子 中 ， 我 们 都 指出 了 等 价 的 SQL 语句 作为 比较 。 

查询 3.1 (再 次 查询 ) 检索 所 有 的 行 、 列 

列 出 所 有 录像 的 详细 信息 

图 3-2a 显 示 了 该 查询 的 QBE 栅 格 。 在 栅 格 的 顶部 ， 显 示 了 我 们 希望 查询 的 表 。 对 于 每 个 
显示 的 表 ，Microsoft Access 将 显示 那个 特定 表 中 的 所 有 字段 ， 然 后 ， 我 们 就 可 以 将 我 们 希望 
在 结果 表 中 看 到 的 字段 拖 到 QBE 栅 格 底部 的 “字段 ” 行 中 。 在 这 个 具体 的 例子 中 ， 我 们 希望 
看 到 Video 表 中 的 所 有 行 ， 所 以 我 们 将 栅 格 上 部 的 “*” 拉 到 Field 行 中 。 默 认 时 ，Microsotft 
Access 将 标记 Show 行 中 相应 的 单元 格 ， 来 表明 在 结果 表 中 显示 的 字段 。 





Video 表 字段 列表 


字段 查询 要 求 


在 结果 表 中 需要 
显示 的 字段 上 打 勾 


a) b) 


图 3-2 a) 查询 3.1 对 应 的 QBE: 列 出 所 有 录像 的 详细 信息 ; b) 与 之 等 价 的 SQL 语 句 


查询 3.6 。 (再 次 查询 ) 范围 查询 条 件 (BETWEEN/NOT BETWEEN) 

列 出 所 有 年 薪 在 $45000 和 $50000 之 间 的 员工 信息 

该 查询 的 QBE 栅 格 如 图 3-3a 所 示 。 在 这 个 例子 中 ， 我 们 在 QBE 栅 格 的 上 部 显示 了 Staff 表 ， 
然后 将 相关 的 字段 拖 到 了 栅 格 底部 的 Field 行 中 。 在 这 个 具体 的 例子 中 ， 我 们 也 指定 了 限制 在 
结果 表 中 显示 的 行 的 条 件 ， 就 是 “salary>=45000 AND salary<=50000”, 所 以 在 salary 列 下 的 
Criteria 单 元 格 中 我 们 输入 了 条 件 “salary>=45000 AND salary<=50000”。 
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注意 ， 如 果 条 件 涉及 到 了 OR 运算 ， 则 条 件 中 的 每 个 部 分 需要 输入 到 不 同 的 行 中 ， 就 
像 图 3-3c 所 示 ， 此 图 显示 了 条 件 (category='Action' OR category='Children )。 









SELECT staffNo, name, position, salary 
FROM Stcrf 
WHERE saicry >= 45000 AND salcry <= 50000.; 


等 价 于 : 
”category="ActionOR 
category= "Children” 





图 3-3 a) 与 查询 3.6 相 对 应 的 QBE 一 一 列 出 年 收入 在 $45 000 和 $50 000 之 间 的 所 有 员工 ; 
b) 与 之 等 价 的 SQL 语句 ; c) 怎样 输入 涉及 到 “或 ”条 件 的 规则 的 例子 

查询 3.10 (再 次 查询 ) 给 结果 排序 

列 出 所 有 录像 ， 按 价格 降序 排列 

本 查询 的 QBE 栅 格 如 图 3-4a 所 示 。 在 这 个 特殊 的 例子 中 ， 我们 希望 按 价格 降序 排列 结果 
表 ， 可 以 在 price 字 段 的 Sort 单 元 格 中 的 下 拉 列 表 框 中 选择 Descending (降序 ) 来 实现 该 功能 。 
注意 在 本 例 中 ，price 字 段 并 没有 被 标记 为 在 结果 中 显示 ， 因 为 该 字段 已 经 在 第 一 个 Field 单 元 
格 申 通过 使 用 “*” 包 括 在 结果 表 中 了 。 

查询 3.11 (再 次 查询 ) 使 用 COUNT 和 SUM 

列 出 年 薪 高 于 $40000 的 员工 总 数 和 他 们 的 年 薪 总 和 

,该 查询 的 QBE 栅 格 如 图 3-5a 所 示 。 在 本 例 中 ， 我 们 希望 计算 出 员工 子 集 ( 年薪 高 于 
$40000 的 员工 ) 的 员工 总 数 和 年 薪 总 和 。 为 了 实现 这 个 目标 ， 我 们 使 用 了 聚合 函数 COUNT 和 
SUM， 通 过 改变 查询 类 型 为 Totals 来 得 到 。 这 使 得 在 QBE 格 中 显示 一 个 附加 的 称 为 Total 的 行 ， 
此 行 包含 GROUP BY 中 已 选择 的 所 有 字段 。 但 是 ， 通 过 使 用 下 拉 列 表 框 ， 我 们 可 以 为 staffNo 
的 Total 选 择 COUNT， 为 salary 的 Total 选 择 SUM。 为 了 使 输出 行 更 加 直观 ， 我 们 可 以 分 别 改变 
totalStaff 和 totalSalary 在 输出 结果 中 显示 的 字段 标题 。 条 件 “>40000” 将 输入 到 salary 字 段 中 
的 Criteria 单 元 格 中 。 
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结果 表 将 按 


FROM Video 
ORDER BY price DESC: 
b) 


图 3-4 a) 与 查询 3.10 相 对 应 的 QBE 一 一 按 价格 递减 顺序 排列 所 有 录像 : b) 等 价 的 SQL 语 句 








改变 totalStaff 与 
totalSalary 的 字段 标题 


tw 





当 查 询 类 型 随 着 Totals 改 变 
时 可 以 指定 聚合 函数 


a) 
SELECT COUNTstaffNo) As totalStaff , SUM(saiary) AS totalSalory 


FROM Staff 
WHERE salary > 40000: 


b) 


图 3-5 a) 与 查询 3.11 相 对 应 的 QBE 一 一 列 出 年 薪 高 于 $40 000 的 员工 人 数 
以 及 他 们 的 年 薪 总 额 ; b) 等 价 的 SQL 语 句 


查询 3.14 “(再 次 查询 ) 使 用 HAVING 

对 于 有 多 于 一 个 员工 的 分 公司 办 公 室 ， 找 出 这 些 分 公司 的 员 工 数 和 分 公司 的 总 年 薪 

该 查询 的 QBE 栅 格 如 图 3-6a 所 示 : 参照 前 面 的 查询 ， 我 们 将 查询 类 型 改 为 Totals ， 使 用 
COUNT 和 SUM 功 能 来 计算 要 求 的 总 额 。 但 是 ， 在 这 个 特定 的 例子 中 ,我 们 需要 根据 分 公司 号 
来 分 组 信息 ( 我 们 需要 计算 每 个 分 公司 的 总 额 )， 所 以 branchNo 字 段 的 Total 单 元 格 需要 设 为 
GROUP BY。 同样， 为 了 使 输出 行 更 加 直观 ， 我 们 可 以 修改 totalStaff 和 totalSalary 的 标题 名 。 
由 于 我 们 只 希望 显示 员工 人 数 多 于 一 人 的 那些 分 公司 的 信息 ， 所 以 我 们 在 COUNT(staffNo) 字 
段 的 条 件 中 输入 “>1”。 

查询 3.17 (再 次 查询 ) 简单 连接 

列 出 所 有 录像 及 它们 的 导演 

该 查询 的 QBE 栅 格 如 图 3-7a 所 示 。 在 栅 格 的 顶部 ， 显示 了 我 们 希望 查询 的 表 ， 在 本 例 中 
就 是 Video 和 Director 两 个 表 。 如 前 所 述 ， 我 们 将 希望 在 输出 结果 中 包括 的 列 拖 到 栅 格 底部 。 
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注意 ， 在 SQL 查询 中 我 们 需要 指定 Director 和 Video 表 的 连接 ， 但 是 ，QBE 可 以 自动 实 


现 连接 。 在 这 些 方面 ，QBE 远 比 SQL 容 易 使 用 。 





当 查询 类 型 随 Totals 改 
变 时 ， 分 组 和 聚合 国 
数 可 以 被 指定 





用 Criteria 在 聚合 函数 
Coumt(StaffNo) 上 指定 分 组 的 限制 


a) 


SELECT brcmchNo. COUNT(staifNo) AS totalStadf. SMWMaalery) AS totcdSalcay 
FROM Stcdf 
GROUP BY branchNo 
HAVING COUNT(staffNo) > 1 
ORDER BY bronchNo; 
b) 


图 3-6 a) 与 查询 3.14 相 对 应 的 QBE 一 一 对 于 每 个 工作 人 员 多 于 一 人 的 分 公司 ， 找 出 在 
每 个 分 公司 工作 的 人 数 和 他 们 的 年 薪 总 额 ; b) 等 价 的 SQL 语 句 


连接 线 代表 一 对 多 的 关系 
(如 所 示 1 到 ) 





a) 


SELECT catalogNo, title, category, v.directorNo, directorName 
FROM Video v, Director d 
WHERE vdirectorNo = d.directorNo: 

b) 


图 3-7 a) 与 查询 3.17 相 对 应 的 QBE 一 一 列 出 所 有 录像 以 及 它们 相应 的 导演 ; b) 等 价 的 SQL 语句 
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查询 3.18 (再 次 查询 ) 四 表 连 接 

列 出 所 有 录像 以 及 它们 的 导演 、 演 员 名 单 和 相应 的 角色 

该 查询 的 QBE 栅 格 如 图 3-8a 所 示 。 在 栅 格 的 顶部 ， 我 们 显示 了 和 希望 查询 的 四 张 表 。 如 前 
所 述 ， 我 们 将 希望 在 输出 结果 中 包括 的 列 拖 放 到 栅 格 底部 。 如 果 表 间 已 经 建立 好 了 合适 的 关 
系 ， 则 QBE 会 根据 栅 格 顶部 表示 的 连接 列 自动 连接 四 张 表 。 


三 条 连接 线 ， 每 条 线 代 表 一 个 一 
对 多 的 关系 (如 所 示 1~% ) 





SELECT v catalogNo, title, category, directorNoame, actorName, chcracter 
FROM Video v, Director Gd, Actor a, Role r 
WHERE d.directcrNo = v.directorNo AND 

V.cctclogNe = r.catalogNo AND 

r.actorNo = ccictorNO: 

b) 
图 3-8 a) 与 查询 3.18 相 对 应 的 QBE 一 一 列 出 所 有 录像 以 及 它们 相应 的 导演 的 名 字 ， 
演员 的 名 字 和 相关 的 角色 ; b) 等 价 的 SQL 语 句 


3.5 本 章 小 结 


“SQL 是 一 种 非 过 程 化 语言 ， 它 由 标准 英语 单词 (如 SELECT、INSERT、 UPDATE 和 
DELETE 等 ) 组 成 ， 可 同时 供 专业 人 员 和 非 专 业 人 员 使 用 。 它 是 定义 和 操纵 关系 数据 库 
的 正式 的 和 事实 上 的 标准 语言 。 

"SELECT 语句 是 SQL 语言 中 最 重要 的 语句 ， 我 们 用 它 来 表达 一 个 查询 。 每 个 SELECT 语 
句 产生 一 个 由 一 个 或 多 个 列 组 成 的 包含 零 行 或 多 行 数据 的 查询 结果 表 。 

“SELECT 子 句 指定 出 现在 结果 表 中 的 列 和 (或 ) 计算 所 得 的 数据 。 所 有 在 SELECT 子 名 
中 出 现 的 列 名 都 必须 能 够 从 FROM 子 句 列表 中 找到 相应 的 表 或 视图 。 

"WHERE 子 句 通过 为 表 中 行 指定 查询 条 件 来 选择 需要 在 结果 表 中 出 现 的 行 。ORDER BY 
子 句 允许 结果 表 按 一 列 或 多 列 列 值 来 排序 。 每 一 列 都 可 以 按 升序 或 降序 排列 。 如 果 指定 
了 ORDER BY 子 句 ， 那么 该 子 句 就 必须 作为 SELECT 语句 的 最 后 一 个 子 句 。 
“SQL 支持 五 个 聚合 函数 (COUNT、SUM、AVG、 MIN 和 MAX)， 它 们 将 整 列 作为 一 个 
参数 并 计算 出 一 个 值 作为 结果 。 在 SELECT 子 句 中 将 聚合 函数 和 列 名 混合 使 用 是 非法 的 
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除非 使 用 了 GROUP BY 子 句 。 

。GROUP BY 子 名 允许 在 结果 表 中 加 入 概要 信息 。 一 列 或 多 列 值 相 同 的 行 可 以 归 入 一 个 组 
中 ， 并 在 使 用 聚合 函数 时 作为 一 个 整体 。 这 样 ， 聚 合 函 数 以 每 个 分 组 作为 一 个 参数 并 为 
每 个 组 计算 出 一 个 值 作为 结果 。 对 于 组 来 说 ，HAVING 子 名 的 作用 同 WHERE 子 句 一 样 ， 
用 于 限制 出 现在 结果 表 中 的 组 。 但是， 与 WHERE 子 句 不 同 ，HAVING 子 名 可 以 包含 罕 
合 函 数 。 

.拉夫 说 是 其 人 到 另 _ 个 址 询 中 的 “个 完 玫 的 SELECT 语句 。 子 查询 可 以 出 现在 外 层 
SELECT 语句 中 的 WHERE 或 HAVING 子 句 中 ,通常 被 称 为 子 查 询 或 圣 套 查询 。 从 理论 上 
来 说 ， 子 查询 产生 一 个 包含 可 以 供 外 层 查询 访问 的 数据 项 的 临时 表 。 子 查询 可 以 嵌入 到 
另 一 个 子 查询 中 。 

。 如 果 结 果 表 中 的 列 来 自 多 个 表 ， 那 么 就 需要 使 用 连接 操作 。 通 过 在 FROM 子 句 中 指定 多 
个 表 ， 然 后 在 WHERE 子 句 中 指定 连接 列 就 可 以 实现 表 的 连接 。 

。 和 SELECT 一 样 ，SQL DML 还 包括 INSERT 语 句 用 来 向 表 中 加 入 一 行 数据 或 使 用 子 查询 
(subselect) 从 另外 一 张 表 中 选择 一 些 行 插入 表 中 ; UPDATE 语 句 用 于 更 新 表 中 指定 列 的 
一 个 或 多 个 值 ; PELETE 语 句 用 于 从 表 中 删除 一 行 或 多 行 数 据 。 

。ISO 标 准 提供 了 八 种 基本 数据 类 型 : boolean (布尔 型 )、character (字符 型 )、bit ( 位 型 )、 
exact numeric ( 精确 数值 型 ) 、approximate numeric (近似 数 )、datetime (日 期 时 间 型 )、 
interval (时 间 间 隔 型 ) 和 character/binary 大 对 象 型 。 

“SQL DDEL 语 名 允许 定义 数据 库 对 象 。 本 章 介 绍 的 两 种 数据 库 定义 语言 为 CREATE 
TABLE 和 CREATE VIEW 。 

*“QBE 是 另 一 种 基于 图 形 的、 采用 点 击 方法 查询 数据 库 的 方法 。QBE 被 誉 为 非 专业 用 户 从 
数据 库 中 得 到 信息 的 最 便捷 的 方法 之 一 。 


复习 题 


3.1 SQL 的 两 个 主要 部 分 是 什么 ? 它们 各 自 有 什么 功能 ? 

3.2 解释 SELECT 语句 中 各 个 子 句 的 功能 。 这 些 子 名 有些 什 么 限制 ? 

3.3 在 SELECT 语句 中 使 用 聚合 函数 时 有 什么 限制 ? 空 值 对 聚合 函数 有 何 影响 ? 

3.4 解释 GROUP BY 子 句 是 怎样 工作 的 。WHERE 子 句 和 HAVING 子 句 之 间 有 什么 区 别 ? 
3.5 子 查询 和 连接 操作 有 什么 不 同 之 处 ? 在 什么 情况 下 我 们 不 能 使 用 子 查询 ? 

3.6 什么 是 QBE? QBE 和 SQL 之 间 的 联系 是 什么 ? 





练习 
下 面 的 凡 张 表 组 成 了 关系 数据 库 管 理 系统 中 某 个 数据 库 的 一 部 分 : 
Hotel (hotelNo, hotelName, city) 
Room (roomNo, hotelNo, type, price) 








Booking (hotelNo, guestNo, dateFrom, dateTo, roomNo) 

Guest (guestNo, guestName, guestAddress) 
这 里 ，Hotel 包 含 了 旅馆 的 详细 信息 ，hotelNo 是 主键 。 
Room 包含 了 每 个 旅馆 的 房间 详细 信息 ，(roomNo, hotelNo) 是 该 表 的 主键 。 
Booking 包 含 了 订房 的 详细 信息 ，(guestNo, hotelNo，, dateFrom) 构 成 了 主键 。 
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Guest 包 含 了 顾客 的 详细 信息 ，guestNo 是 主键 。 

1. 创建 表 

3.7 用 SQL 创建 上 述 各 表 (需要 时 ， 创 建 主键 和 外 键 )。 

2. 填充 表 

3.8 ”向 这 些 表 中 添加 一 些 行 。 

3.9 更 新 表 ， 使 所 有 房间 的 价格 上 涨 5%。 

3. 简单 查询 操作 

3.10 列 出 所 有 旅馆 的 详细 信息 。 

3.11 列 出 位 于 华盛顿 的 所 有 旅馆 的 详细 信息 。 

3.12 列 出 住 在 华盛顿 的 所 有 顾客 的 姓名 和 地 址 ， 按 顾客 姓名 的 字母 顺序 排序 。 

3.13 列 出 每 晚 价格 低 于 $40.00 的 所 有 双人 房间 和 家 庭 套间 ， 按 价格 升序 排列 。 

3.14 列 出 没有 指定 截止 日 期 dateTo 的 所 有 订单 。 

4. 聚合 函数 

3.15 统计 总 共有 多 少 个 旅馆 ? 

3.16 所 有 房间 的 平均 价格 是 多 少 ? 

3.17 所 有 双人 房间 每 晚 的 费用 总 和 是 多 少 ? 

3.18 有 多 少 不 同 的 顾客 在 八 月 份 预订 了 房间 ? 

5. 子 查询 和 连接 操作 

3.19 列 出 Hilton Hotel 的 所 有 房间 的 价格 和 类 型 。 

3.20 列 出 现在 住 在 Hilton Hotel 的 所 有 顾客 。 

3.21 列 出 Hilton Hotel 所 有 房间 的 详细 信息 ， 包 括 在 该 房间 入住 的 顾客 的 名 字 (如 果 该 房 
间 已 经 有 人 住 的 话 ) 。 

3.22 今天 Hilton Hotel 订 房 的 总 收入 是 多 少 ? 

3.23 列 出 Hilton Hotel 中 今天 没有 住 客 的 房间 。 

3.24 Hilton Hotel 中 由 于 这 些 没 有 入 住 的 房间 ， 会 造成 多 大 损失 ? 

6. 分 组 

3.25 列 出 任 一 旅馆 的 房间 数量 。 

3.26 列 出 在 华盛顿 的 任 一 旅馆 的 房间 数量 。 

3.27 八 月 份 ， 每 个 旅馆 的 平均 订房 数 为 多 少 ? 

3.28 华盛顿 每 个 旅馆 最 常 被 定 的 房间 的 类 型 是 什么 ? 

3.29 今天 每 家 旅馆 由 于 没有 入 住 的 房间 造成 的 损失 各 有 多 少 ? 





第 4 章 数据 库 应 用 程序 生命 周期 





本 章 主 题 : 

* 软件 开发 带 来 的 问题 导致 了 软件 危机 。 

“软件 危机 导致 了 结构 化 方向 到 称 为 信息 系统 生命 周期 的 软件 开发 。 

“数据 库 系 统 开发 生命 周期 和 信息 系统 生命 周期 之 间 的 关系 。 

“ 数据库 系 统 开 发 周期 的 主要 阶段 。 

“数据 库 系 统 开发 生命 周期 每 个 阶段 的 相关 话 动 。 

本 章 以 为 什么 开发 软件 应 用 程序 需要 结构 化 方法 作为 开始 ， 介 绍 了 称 为 信息 系统 生命 周 
期 方法 的 例子 ， 讨 论 了 信息 系统 和 支持 它 的 数据 库 之 间 的 关系 。 然 后 聚焦 于 数据 库 ， 介 绍 了 
称 为 数据 库 系统 开发 生命 周期 的 开发 数据 库 系统 的 结构 化 方法 的 例子 。 最 后 ， 介 绍 了 组 成 数 
据 库 系统 开发 生命 周期 (DSDLC) 的 各 阶段 。 


4.1 软件 危机 


你 可 能 已 经 意识 到 过 去 的 几 十 年 中 ， 软 件 开 发 在 数量 上 有 着 惊人 的 增长 ， 从 小 型 、 由 几 
行 代码 组 成 的 相对 简单 的 应 用 程序 到 大 型 的 、 由 成 百 万 行 代码 组 成 的 复杂 的 应 用 程序 。 开 发 
完成 之 后 ， 许 多 应 用 程序 表明 ， 这 些 程序 还 需要 进行 不 断 的 维护 。 这 种 维护 包括 修改 错误 、 
实现 新 的 用 户 需 求 或 者 修改 软件 使 之 运行 于 新 的 或 升级 的 平台 上 。 为 了 支持 这 些 ， 花 费 在 维 
护 上 的 精力 开始 以 惊人 的 速率 吸收 资源 。 其 结果 是 ， 许 多 主要 的 软件 工程 延期 、 超 过 预算 ， 
并 且 开 发 出 的 软件 不 可 靠 ， 难 于 维护 并 且 性 能 差 。 这 导致 我 们 所 知道 的 软件 危机 。 尽 管 这 个 
术语 首先 用 于 20 世 纪 60 年 代 末 ,但 在 30 多 年 之 后 ， 危 机 仍然 伴随 着 我 们 。 软 件 危 机 的 一 种 迹 
象 就 是 ，OASIG (一 个 关心 IT 业 的 组 织 方面 的 特别 调查 小 组 ) 在 UK 的 一 份 调查 ， 得 到 如 下 结 
论 (OASIG，1996， 见 参考 文献 ): 

*80% ~ 90% 的 系统 没有 达到 性 能 目标 。 

“大 约 80% 的 交付 延期 或 者 超出 预算 。 

。 大约 40% 开 发 失败 或 者 放弃 。 

*40% 以 下 的 完全 达到 了 训练 和 技术 要 求 。 

“不 到 25% 达 到 了 业务 和 技术 两 方面 的 目标 。 

“只 有 10%~20% 达 到 了 所 有 的 成 功 标准 。 

软件 工程 的 失败 有 几 个 主要 原因 ， 包 括 : 

“ 缺乏 完全 明确 的 需求 说 明 。 

“缺乏 合适 的 开发 方法 。 

* 错误 地 将 设计 分 解 为 易 管 理 的 组 件 。 

这 些 问题 的 一 个 解决 方法 就 是 ， 提 出 了 软件 开发 的 结构 化 方法 ， 通常 被 称 为 信息 系统 生 


命 周 期 (Information Systems Lifecycle) 或 者 是 软件 开发 生命 周期 (Software Development 
Lifecycle, SDLC ) 。 
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4.2 信息 系统 生命 周期 
信息 系统 (Information System ) ” 收集、 管理、 控制 和 分 发 全 公司 数据 或 信息 的 资源 。 





信息 系统 不 只 是 收集 、 管 理 、 控 制 数 据 的 使 用 和 产生 ， 而 且 也 将 数据 转变 为 信息 。 信 息 
系统 也 为 那些 对 公司 的 成 功 与 否 作出 重大 决定 的 公司 管理 者 提供 有 利 的 依据 。 信 息 系 统 中 基 
本 的 核心 组 件 是 支持 它 的 数据 库 。 

通常 ， 信 息 系统 生命 周期 的 阶段 包括 : 规划 、 需 求 收集 和 分 析 、 设 计 (包括 数据 库 设计 )、 
构造 原型 、 实 现 、 测 试 、 转 换 以 及 操作 维护 。 当 然 ， 本 书 中 ， 我 们 感 兴趣 的 是 信息 系统 的 数 
据 库 组 件 的 开发 。 由 于 数据 库 是 较 大 型 企业 的 信息 系统 的 基础 组 件 ， 因 此 数据 库 系 统 开发 生 
命 周期 与 信息 系统 生命 周期 存在 内 在 的 必然 关系 。 


4.3 数据 库 系 统 开发 生命 周期 


本 章 中 ， 我 们 介绍 了 关系 DBMS 的 数据 库 系统 开发 生命 周期 。 数 据 库 系统 开发 生命 周期 
(DSDLC) 各 阶段 的 概要 如 图 4-1 所 示 。 每 个 阶段 的 名 称 下 面 是 本 章 要 描述 该 阶段 的 节 。 注 意 ， 
数据 库 系 统 开发 生命 周期 并 不 是 严格 顺序 进行 的 ， 而 是 通过 反复 循环 包含 前 面 步 又 的 一 些 重 
复 。 例 如 ， 在 数据 库 设计 期 间 遇 到 了 问题 ， 可 能 就 需要 其 他 的 需求 收集 和 分 析 。 因 为 在 大 多 
数 步 允 之 间 有 反复 循环 ， 因 此 ， 我 们 只 在 图 4-1 中 画 出 了 一 些 明 显 的 反复 。 

对 用 户 较 少 的 小 型 数据 库 应 用 程序 来 说 ， 生 命 周 期 可 能 不 必 很 复杂 。 但 是 ， 当 要 为 成 千 
上 万 用 户 设计 大 型 的 数据 库 系统 时 ， 生 命 周 期 就 变 得 极为 复杂 。 


4.4 数据 库 规 划 
数据 库 规划 (Database Planning) 尽 可 能 有 效 地 实现 数据 库 应 用 的 各 阶段 的 管理 活动 。 


创建 数据 库 工 程 的 起 点 就 是 数据 库 系统 的 任务 陈述 和 任务 目标 。 任 务 陈述 定义 了 数据 库 
系统 的 主要 目标 ， 而 每 个 任务 目标 标识 了 数据 库 必 须 支持 的 特定 任务 。 当 然 ， 与 所 有 工程 一 
样 ， 数 据 库 规划 过 程 中 必然 包括 对 工作 量 的 估计 、 使 用 的 资源 和 需要 的 经 费 。 

正如 我 们 已 经 注意 到 的 ， 数 据 库 通常 是 大 型 企业 信息 系统 的 不 可 分 割 的 一 部 分 ， 因 此 ， 
任何 数据 库 工程 都 应 该 完整 地 包含 于 公司 的 全 局 IS 策 略 中 。 


数据 库 规划 也 可 以 包括 如 何 收集 数据 、 如 何 指定 格式 、 需 要 什么 样 的 文档 、 如 何 
进行 设计 和 实现 的 标准 的 开发 。 开 发 和 维护 标准 是 很 费时 的 ， 从 开始 的 建立 到 后 续 的 
维护 者 需要 资源 。 但 是 ， 设 计 良好 的 标准 为 训练 职工 和 衡量 质量 提供 了 基础 ， 并 且 确 
保 了 工作 遵循 的 模板 ,而 与 职工 的 技能 和 经 验 无 关 。 任 何 合法 的 或 公司 的 需求 都 应 该 
存档 ， 例 如 某 些 数据 类 型 的 约定 必须 存档 ， 或 者 保存 一 定 的 时 间 。 











4.5 系统 定义 
系统 定义 (System Definition) ”定义 数据 库 应 用 程序 的 范围 和 这 界 ， 包 括 主要 的 用 户 视图 。 


在 试图 设计 数据 库 系 统 之 前 ， 首 先 标明 我 们 要 研究 的 系统 的 范围 和 边界 以 及 它 和 公司 信 
息 系 统 的 其 他 部 分 的 接口 是 很 有 必要 的 。 图 4-2 说 明了 如 何 描述 StayHome 的 数据 库 应 用 程序 的 














和 4 竟 数据 亩 应 有 程序 生命 周期 53 






数据 库 规 划 
4.4 节 ) 





(4.5 节 ) 


需求 的 收集 与 分 析 
(4.6 节 ) 
逻辑 设计 


ee 






应 用 程序 设计 
(4.9 节 ) 


选择 DBMS (可 选 ) 
(4.8 节 ) 











构建 原型 (可 选 ) 
(4.10 节 ) 








数据 转换 与 加 载 
(4.12 节 ) 











测试 
(4.13 节 ) 







操作 性 维护 
(4.14 节 ) 


图 4-1 数据 库 应 用 程序 生命 周期 的 主要 步骤 


系统 边界 。 在 为 数据 库 应 用 程序 定义 系统 边界 时 ， 我 们 不 仅 要 考虑 当前 的 用 户 视图 ， 也 要 考 
虑 未 来 的 用 户 视图 。 


注意 ， 这 种 类 型 的 图 可 以 画 到 任何 一 个 层次 。 这 种 图 的 另 一 个 例子 ( 低 一 层次 ) 为 图 6.9。 
用 户 视 图 


用 户 视 图 (User View) 
如 市 场 、 职 














从 特定 工作 (例如 经 理 人 或 管理 者 ) 或 者 业务 应 用 领域 ( 例 
员 或 库存 控制 ) 的 角度 ， 定 义 的 数据 库 应 用 的 需求 。 
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数据 库 系 统 可 以 有 一 个 或 多 个 用 户 视图 。 标 明 用 户 视图 是 开发 数据 库 应 用 程序 的 一 个 重 
要 方面 ， 因 为 它 可 以 帮助 确定 当 为 新 的 应 用 程序 开发 需求 时 ， 数 据 库 的 主要 用 户 都 已 经 考虑 
到 了 。 在 开发 相对 复杂 的 数据 库 应 用 程序 时 ， 用 户 视图 对 允许 将 需求 分 解 为 易 处 理 的 小 片段 
也 非常 有 帮助 。 

用 户 视 图 定义 了 根据 要 存储 的 数据 和 在 数据 上 要 执行 的 事务 而 得 到 的 所 需 的 数据 库 应 用 程 
序 ( 换 名 话说， 用 户 要 怎样 使 用 数据 )。 一 个 用 户 视图 的 需求 可 能 不 同 于 其 他 视图 或 其 他 视图 
的 视图 。 图 4-3 为 多 用 户 视图 的 数据 库 系统 的 图 示 (用 户 视图 1~6)。 注 意 ， 用 户 视图 (1、2、 
3) 和 (5、6) 有 重合 需求 (用 较 深 颜色 标识 )， 用 户 视图 4 有 不 同 的 需求 。 





图 4-2 StayHome 录 像 出 租 公司 的 数据 库 系 统 边 界 


数据 库 系统 





图 4-3 有 多 用 户 视 图 的 数据 库 系统 : 视图 4 是 独立 的 ， 其 他 的 视图 有 部 分 元 素 重 又 
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4.6 需求 的 收集 与 分 析 


需求 的 收集 与 分 析 (Requirements Collection and Analysis) 收集 和 分 析 数 据 库 所 支持 的 
公司 信息 ， 并 使 用 这 些 信 息 来 标识 新 的 数据 库 系 统 需求 的 过 程 。 
在 本 阶段 中 ， 我 们 收集 和 分 析 公司 或 公司 的 部 分 信息 ,这 些 信息 将 被 保存 在 数据 库 中 。 收 
集 信 息 有 许多 技术 ， 称 为 事实 发 现 的 技术 ， 我 们 将 在 第 6 章 详 细 讨 论 。 
我 们 为 每 个 主要 的 用 户 视图 (也 就 是 ， 工作 角色 或 业务 应 用 领域 ) 收集 信息 ， 包 括 : 
。 对 使 用 或 产生 的 数据 的 描述 。 
。 如 何 使 用 和 产生 数据 的 详细 情况 。 
。 新 数据 库 系统 的 所 有 附加 需求 。 
接 下 来 ， 我 们 分 析 这 些 信息 以 标识 包含 在 新 数据 库 系 统 中 的 需求 (特征 )。 这 些 信息 在 文 
档 中 被 描述 为 新 的 数据 库 系统 的 需求 说 明 。 
提示 需求 收集 和 分 析 是 数据 库 设 计 的 准备 阶段 ， 收 集 的 数据 的 多 少 和 问题 的 种 类 及 公司 
的 策略 有 关 。 为 数据 库 系统 确定 需要 的 功能 是 一 个 关键 的 活动 ， 如 果 系统 功能 不 够 或 不 
完整 会 让 用 户 很 烦恼 ， 并 且 可 能 会 导致 用 户 拒绝 或 无 法 充分 利用 系统 。 但 是 ， 过 多 的 功 
能 也 会 有 问题 ， 因 为 它 可 能 会 是 一 个 过 于 复杂 的 系统 ， 并 难于 实现 、 维 护 、 使 用 和 学 习 。 
这 个 步骤 的 另 一 个 重要 的 活动 就 是 确定 怎样 处 理 多 用 户 视图 的 情况 。 处 理 多 用 户 视图 有 
三 个 主要 的 方法 : . 
。 集 中 式 方法 。 
* 视图 集成 方法 。 
。 以 上 两 种 方法 的 结合 。 
1. 集中 式 方法 














集中 式 方法 (Centralized Approach) ”对 于 新 数据 库 系统 来 说 ， 需 要 将 每 个 用 户 视图 
合并 到 一 个 需求 列表 中 。 在 数据 库 设计 阶段 创建 表示 所 有 用 户 视图 的 数据 模型 。 


集中 式 方 法 涉及 把 不 同 用 户 视图 的 需求 并 合并 到 一 个 需求 列表 中 。 在 数据 库 设计 阶段 创建 
表示 所 有 用 户 视图 的 数据 模型 。 图 4-4 显 示 的 是 使 用 集中 式 方法 对 用 户 视图 1 到 3 的 管理 。 通 常 ， 
当 每 个 用 户 视图 的 需求 有 较 大 的 重合 并 且 数 据 库 系统 不 是 很 复杂 时 ， 使 用 这 个 方法 比较 合适 。 
2. 视 图 集成 方法 






视图 集成 方法 (View Integration Approach) 每 个 用 户 视图 的 需求 部 被 用 来 构建 该 用 户 
视图 的 独立 的 数据 模型 ， 最 终 的 数据 模型 是 在 数据 库 设 计 的 后 续 步 骤 中 通过 合并 得 到 


的 。 


视图 集成 方法 将 每 个 用 户 视图 的 需求 列 出 独立 的 需求 表 。 我 们 创建 代表 每 个 用 户 视图 的 
数据 模型 ， 描 述 单个 用 户 视图 的 数据 模型 称 为 局 部 逻辑 数据 模型 。 然 后 合并 这 些 局 部 数据 模 
型 创建 表达 组 织 中 所 有 用 户 视图 的 全 局 逻辑 数据 模型 。 

图 4-5 显 示 了 使 用 视图 集成 方法 管理 用 户 视图 1~3。 通 常 ， 当 在 用 户 视图 间 存 在 相当 大 的 
差异 并 且 数 据 库 系统 相对 比较 复杂 时 ， 使 用 这 个 方法 比较 合适 ， 它 将 整个 工作 划分 成 更 易 管 
理 的 几 个 部 分 。 
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用 户 视 图 1 







用 户 视图 2 


用 户 视图 3 


所 有 用 户 





逻辑 数据 模型 
图 4-4 处 理 多 用 户 视图 1~3 的 集中 式 方 法 


提示 对 于 一 些 复杂 的 数据 库 系 统 ， 将 集中 式 方法 和 视图 集成 方法 结合 使 用 来 管理 多 用 
户 视图 可 能 会 比较 合适 。 例 如 ， 两 个 或 多 个 用 户 视图 的 需求 可 以 首先 使 用 集中 式 方法 
进行 合并 ， 然 后 使 用 它 来 创建 局 部 逻辑 数据 模型 。( 因此 在 这 种 情况 下 ， 局 部 数据 模型 
不 仅 代表 一 个 用 户 视图 ， 而 是 代表 使 用 集中 化 方法 合并 在 一 起 的 一 些 用 户 视图 。) 然后 
使 用 视图 集成 方法 将 表达 一 个 或 多 个 用 户 视图 的 局 部 数据 模型 组 成 表达 所 有 用 户 视图 
的 全 局 逻辑 数据 模型 。 


我 们 将 在 6.4.4 节 更 详细 地 讨论 如 何 管理 多 个 用 户 视图 ， 并 在 本 书 中 演示 如 何 使 用 集中 式 
方法 和 视图 集成 方法 为 StayHome 录 像 租借 公司 构建 数据 库 。 


4.7 ”数据 库 设计 


数据 库 设计 ;(Database Design) ”创建 支持 公司 的 任务 陈述 和 任务 目标 的 数据 库 系 统 的 


设计 的 过 程 。 





数据 库 设 计 由 两 个 主要 阶段 组 成 , 分 别称 为 逻辑 和 物理 设计 。 在 逻辑 数据 库 设 计 阶段 ， 
我 们 要 标识 数据 库 中 要 描述 的 重要 对 象 以 及 这 些 对 象 之 间 的 关系 。 在 物理 数据 库 设计 阶 
段 ， 我 们 要 确定 逻辑 设计 如 何在 目标 DBMS 中 物理 地 实现 。 在 第 9 章 ， 我 们 将 更 详细 地 讨 
论 数据 库 设计 的 这 两 个 阶段 ， 并 概要 介绍 逻辑 和 物理 数据 库 设计 的 每 个 步 又 。 逻 辑 数据 
库 设计 方法 的 步骤 将 在 第 9 章 和 第 10 章 中 详细 描述 ， 物理 数据 库 设计 将 在 第 12 章 ~ 第 16 章 
介绍 。 
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图 4-5 处 理 多 用 户 视图 1~3 的 视图 集成 方法 





. 4.8 选择 DBMS 
选择 DBMS (DBMS Selection) 指 选 择 合适 的 DBMS 来 支持 数据 库 应 用 程序 。 


如 果 目 前 公司 还 没有 关系 DBMS ， 那 么 生命 周期 中 合适 的 选择 就 是 在 逻辑 和 物理 数据 库 设 
计 阶 段 。 但 是 ， 如 果 已 经 获得 足够 的 关于 系统 需求 的 信息 ， 例 如 网 络 、 性 能 、 重 构 的 难 易 、 安 
全 性 和 完整 性 约束 等 ， 就 可 以 在 先 于 逻辑 设计 之 前 的 任何 时 间 做 出 选择 (完整 性 约束 见 1 3 节 )。 
尽管 选择 DBMS 的 事情 不 经 常 发 生 ， 但 当 要 扩展 业务 或 者 要 替换 现 有 系统 的 时 候 ， 评价 新 的 
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DBMS 产 品 就 变 得 很 有 必要 。 这 时 ， 就 要 选择 一 个 系统 来 满足 公司 目前 和 未 来 的 需求 ， 平 衡 各 方 
面 的 费用 ， 包 括 购买 DBMS 产 品 和 支持 数据 库 系统 的 其 他 软 、 硬 件 需 求 ， 以 及 变更 与 培训 员工 的 


费用 。 
一 个 简单 的 方式 是 根据 需求 核对 DBMS 的 特征 。 在 选择 新 的 DBMS 产 品 时 ， 应 该 确保 选择 


过 程 是 计划 好 的 ， 并 且 系 统 确实 对 公司 有 益 。 
提示 。 现在， 世界 范围 的 网 络 是 信息 的 重要 资源 ， 可 以 用 来 标识 潜在 的 候选 DBMS。 供 
应 商 的 网 络 站 点 提供 了 DBMS 产 品 的 有 价值 的 信息 。 首 先 ， 可 以 浏览 一 下 叫做 DBMS 
ONLINE( 可 以 从 www.intelligententerprise.com 得 到 ) 的 DBMS 杂 志 的 Web 站 点 ， 查 看 一 下 
DBMS 产 品 的 全 面 的 索引 。 


4.9 应 用 程序 设计 


应 用 程序 设计 (Application Design) ”对 用 户 界 面 的 设计 以 及 对 使 用 并 处 理 数据 库 的 应 


用 程序 的 设计 的 过 程 。 


在 图 4-1 中 ， 我 们 了 解 到 数据 库 和 应 用 程序 设计 是 数据 库 系统 开发 生命 周期 中 平行 的 活动 。 
绝 大 多 数 情况 下 ， 在 产生 数据 库 本 身 的 设计 之 前 我 们 不 能 完成 应 用 程序 的 设计 。 另 一 方面 ， 数 
据 库 本 身 就 是 支持 应 用 程序 的 ， 因 此 ,. 在 应 用 程序 设计 和 数据 库 设 计 之 间 一 定 有 信息 流 存在 。 

我 们 必须 确保 需求 说 明 所 有 的 功能 在 数据 库 应 用 程序 的 设计 中 都 体现 出 来 。 这 包括 设计 
用 户 和 数据 之 间 的 交互 ， 我 们 称 之 为 事务 设计 。 除 了 设计 如 何 获得 必需 的 功能 之 外 ， 我 们 还 
要 设计 数据 库 应 用 程序 的 合适 的 用 户 界面 。 


4.9.1 事务 设计 





事务 (Transaction) ”由 一 个 用 户 或 应 用 程序 执行 的 一 个 动作 或 一 系列 动作 ， 它 可 以 访 


问 或 改变 数据 库 的 内 容 。 


事务 代表 了 “现实 世界 ”的 事件 ， 例 如 在 录像 出 租 公 司 登 记 新 的 成 员 ， 为 租 录像 的 成 员 
创建 出 租 协议 ,或 者 增加 新 的 员工 。 这 些 事务 不 得 不 应 用 于 数据 库 ， 以 确保 数据 库 与 当前 的 
“现实 世界 ”一 致 ， 并 且 支 持 用 户 的 信息 需求 。 

事务 设计 的 目的 就 是 定义 并 存档 数据 库 系 统 需 要 的 事务 的 高 层 特性 ， 包 括 : 

* 事务 使 用 的 数据 。 

" 事务 的 功能 特性 (事务 要 做 什么 ) 。 

"事务 的 输出 。 

。 对 用 户 的 重要 性 。 

* 使 用 的 预期 率 。 

有 三 种 主要 类 型 的 事务 : 

* 检索 事务 。 

“更 新 事务 。 

“混合 事务 。 

检索 事务 用 来 检索 显示 于 屏幕 (或 报告 ) 的 数据 ， 或 者 作为 另 一 个 事务 的 输入 的 数据 . 
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例如 ， 查 询 和 显示 录像 (给 定 录像 代码 ) 的 详细 信息 就 是 检索 事务 。 更 新 事务 就 是 用 来 插入 
新 记录 、 删 除 旧 记 录 或 者 修改 数据 库 的 已 经 存在 的 记录 的 事务 。 例 如 ， 向 数据 库 中 插入 新 录 
像 的 详细 信息 就 是 更 新 事务 。 混 合 事务 是 既 检索 数据 又 更 新 数据 的 事务 。 例 如 ， 查 询 并 显示 
录像 的 详细 信息 (给 定 录像 编号 )， 然 后 更 新 日 租金 率 的 值 就 是 混合 事务 。 


4.9.2 用 户 界面 设计 

除了 设计 怎样 实现 必需 的 功能 之 外 ， 我 们 还 必须 为 数据 库 应 用 程序 设计 合适 的 用 户 界面 。 
用 户 界面 应 该 以 用 户 友好 的 方式 显示 需要 的 信息 。 用 户 界面 设计 的 重要 性 有 时 会 被 忽略 ， 或 
者 留 到 了 设计 的 最 后 阶段 。 但 是 ， 应 该 意识 到 界面 可 能 是 系统 中 最 重要 的 构件 之 一 。 如 果 它 
易于 掌握 、 操 作 直观 ， 用 户 就 更 易于 充分 利用 提供 的 信息 。 另 一 方面 ， 如 果 界 面 没 有 这 些 特 
性 ， 那 么 系统 会 产生 问题 。 例 如 ， 在 实现 表格 或 报告 之 前 ， 我 们 首先 设计 输出 界面 是 很 必要 
的 。 表 4-1 列 出 了 设计 表格 或 报告 的 一 些 有 用 的 指导 (Shneiderman, 1992 ) 。 

表 4-1 表格 /报告 设计 概要 





有 意义 的 标题 便利 的 游标 活动 
全 面 的 指导 用 于 单个 字符 和 整个 字段 的 错误 纠正 
字段 的 逻辑 组 合 和 序列 用 于 不 可 接受 值 的 错误 消息 
可 视 化 的 表单 /报表 布局 可 选 字段 标记 清楚 
常用 的 字段 标签 用 于 字段 的 解释 性 消息 
一 致 性 的 术语 和 缩 略 语 完整 的 信号 
一 致 的 颜色 | 
用 于 数据 项 字段 的 可 视 化 空间 和 边界 
4.10 构建 原型 


贯穿 设计 过 程 的 不 同 阶段 ， 我 们 可 以 选择 是 完全 实现 数据 库 系 统 的 设计 还 是 构建 一 个 原型 。 
构建 原型 (Prototyping) 构建 数据 库 系统 的 工作 模型 。 


原型 通常 是 不 包含 全 部 的 需求 特征 或 者 没有 提供 最 终 系统 的 全 部 功能 的 工作 模型 。 开 发 
原型 数据 库 系 统 的 目的 就 是 允许 用 户 使 用 原型 来 标识 系统 的 特征 是 工作 良好 ， 还 是 不 充分 ， 
以 及 如 果 可 能 的 话 提出 改善 甚至 给 数据 库 应 用 程序 添加 新 特征 的 建议 。 按 这 种 方法 ， 我 们 阅 
明了 需求 ， 并 估计 了 特殊 系统 设计 的 可 行 性 。 原 型 应 该 有 相对 便宜 并 容易 构造 的 优点 。 

现在 ， 通 常 有 两 种 原型 法 构造 策略 : 需求 原型 法 和 演化 原型 法 。 需 求 原型 法 使 用 一 个 原 
型 来 确定 提出 的 数据 库 系统 的 需求 ， 并 且 一 旦 完成 需求 ， 原 型 就 被 抛弃 了 。 而 演化 原型 法 也 
是 用 于 相同 的 目的 ， 重 要 的 不 同 之 处 是 该 原型 不 会 被 抛弃 ， 而 是 得 到 进一步 的 开发 ,并 最 终 成 
为 工作 的 数据 库 系 统 。 


4.11 实现 


实现 (Implementation ) 数据 库 和 应 用 程序 设计 的 物理 实现 。 


设计 阶段 完成 后 (可 能 包括 也 可 能 不 包括 原型 )， 就 该 实现 数据 库 和 应 用 程序 了 。 使 用 所 
选 DBMS 的 数据 定义 语言 (Data Definition Language, DDL) 来 完成 数据 库 的 实现 ， 或 者 使 用 
屏蔽 了 低层 的 DDL 语 句 且 提供 了 相同 功能 的 图 形 用 户 接口 (GUD 实 现 数据 库 。DDL 语 名 用 于 创 
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建 数据 库 结构 以 及 空 的 数据 库 文件 。 这 个 阶段 也 实现 具体 的 用 户 视图 。 

应 用 程序 可 以 使 用 第 三 或 第 四 代 语 言 (3GL 或 4GL) 实现 。 这 些 应 用 程序 的 一 部 分 是 数据 
库 事 务 ， 这 个 我 们 使 用 目标 DBMS 的 数据 操作 语言 (DML) 来 实现 ， 这 些 语言 可 能 嵌入 在 主 
语言 中 ， 例 如 Visual Basic(VB)、VB.net、Pythen、Delphi、C、 C++、C#、Java、COBOL.、 
Fortran、Ada 或 者 Pascal。 我 们 也 可 以 实现 应 用 设计 的 其 他 构件 ， 例 如 菜单 屏幕 、 数 据 项 表格 
以 及 报表 。 另 外 ， 目 标 PDBMS 也 可 能 有 自己 的 第 四 代 工 具 ， 它 允许 通过 非 过 程 化 查询 语言 、 
报表 生成 工具 、 表 格 生成 工具 、 应 用 程序 生成 工具 来 快速 开发 应 用 程序 。 . 

应 用 程序 的 安全 性 和 完整 性 控制 也 被 实现 了 。 其 中 的 一 些 控制 是 使 用 DDL 实 现 的， 但 有 
一 些 可 能 需要 使 用 DDL 以 外 的 工具 ， 例 如 提供 的 DBMS 工 具 或 者 操作 系统 控制 。 

SQL( 结 构 化 查询 语言 ) 既 是 DDL， 也 是 DML。 


4.12 数据 转换 与 加 载 


数据 转换 与 加 载 (Data Conversion and Loading) “将 现 有 的 数据 转换 到 新 数据 库 中 ， 并 
转换 现 有 的 应 用 程序 在 新 数据 库 上 运行 。 








只 有 在 新 数据 库 系 统 替换 旧 系 统 时 ， 该 阶段 才 是 必需 的 。 现 在 ， 对 于 DBMS 来 说 ， 提 供 
将 已 有 文件 加 载 到 新 的 数据 库 中 的 工具 是 很 普遍 的 。 该 功能 通常 需要 指明 源 文 件 的 和 目标 数 
据 库 ， 然 后 就 可 以 自动 地 将 数据 转换 为 新 数据 库 文件 中 的 格式 。 如 果 可 以 实现 ， 开 发 者 就 可 
以 在 新 系统 中 转换 和 使 用 月 系统 中 的 应 用 程序 。 当 需要 进行 转换 和 加 载 时 ， 该 过 程 必须 正确 
地 实现 来 确保 全 部 操作 的 平稳 转变 。 


4.13 测试 





测试 (Testing) 以 寻找 错误 为 目的 而 执行 应 用 程序 的 过 程 、 


在 投入 使 用 前 ， 应 该 对 新 开发 的 数据 库 系统 进行 全 面 的 测试 。 测 试 是 通过 精心 制定 的 测 
试 计划 和 真实 数据 来 实现 的 ， 因 此 整个 测试 过 程 都 要 求 系统 地 和 严格 地 执行 。 注 意 ， 在 我 们 
的 测试 定义 中 ,我们 没有 使 用 通常 的 观点 ， 认 为 测试 是 为 了 证 明 不 存在 错误 .实际 上， 测试 
不 能 证 明 没 有 错误 ， 它 只 能 用 来 说 明 软件 错误 的 存在 。 如 果 测试 完成 成 功 ， 它 将 会 揭示 应 用 
程序 或 者 数据 库 结构 方面 的 错误 。 作 为 附加 的 益处 ， 测 试 还 可 以 说 明 数据 库 和 应 用 程序 是 按 
四 它们 的 说 明 来 工作 的 ， 并 且 性 能 需求 得 到 了 满足 。 此 外 ， 从 测试 阶段 收集 来 的 材料 还 提供 
了 衡量 软件 可 靠 性 和 质量 的 标准 。 

在 数据 库 设计 过 程 中 ， 新 系统 的 用 户 也 应 该 包含 在 测试 过 程 中 。 系 统 测试 的 理想 情 最 是 
在 一 个 独立 的 硬件 系统 上 ， 有 一 个 测试 数据 库 ， 但 这 种 情况 通常 是 不 能 获得 的 。 如 果 使 用 真 
实数 据 ， 进 行 备 份 是 很 重要 的 ， 以 防 发 生 错误 。 

测试 也 应 该 包括 数据 库 系 统 的 可 使 用 性 。 理 想 情况 下 ， 评 估 应 该 按照 可 用 性 规格 说 明 来 
进行 。 可 作为 评估 标准 的 例子 包括 (Sommerville，2000): 

“ 可 学 习性 一 一 让 一 个 新 用 户 熟 悉 系 统 需 要 多 长 时 间 ? 

* 性 能 一 一 系统 响应 用 户 工作 的 情况 如 何 ? 

" 健壮 性 一 一 对 于 用 户 错误 的 忍耐 性 如 何 ? 

* 可 恢复 性 一 系统 从 用 户 错误 中 恢复 的 情况 如 何 ? 
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*。 适 应 性 一 一 系统 与 工作 的 一 个 模型 的 绑 定 程 度 如 何 ? 
这 些 标准 中 的 某 一 些 可 以 在 生命 周期 的 其 他 阶段 进行 评估 ， 当 测试 完成 后 ， 数 据 库 系统 
就 准备 停止 这 些 活动 并 移交 给 用 户 了 。 


4.14 操作 性 维护 


操作 性 维护 〈Operational Maintenance ) 监视 和 维护 数据 库 系 统 安装 后 的 情况 。 | 


在 这 个 阶段 中 ， 数 据 库 系统 进入 维护 阶段 ， 包 括 如 下 的 活动 : 

* 监视 数据 库 系 统 的 性 能 。 如 果 性 能 下 降 到 可 接受 水 平 之 下 ， 则 数据 库 需 要 调整 和 改造 。 
“维护 和 升级 数据 库 系统 ( 当 需 要 时 )。 通 过 生命 周期 前 面 的 步 又 ， 新 需求 要 合并 到 数据 
库 系统 中 。 

我 们 将 在 第 16 章 详细 介绍 该 步骤 。 


4.15 本 章 小 结 


* 信息 系统 是 收集 、 管 理 、 控 制 和 分 发 全 公司 数据 或 信息 的 资源 。 

“数据 库 是 信息 系统 的 基础 组 件 。 信 息 系 统 的 生命 周期 是 内 在 关系 于 支持 它 的 数据 库 的 生 
命 周期 的 。 

“数据库 系统 开发 生命 周期 主要 阶段 包括 : 数据 库 规划 、 系 统 定 义 、 需 求 收集 与 分 析 、 数 
据 库 设计 、 选 择 DBMS (可 选 )、 应 用 程序 设计 、 构 建 原 型 (可 选 )、 实 现 、 数 据 转换 和 
加 载 、 测 试 以 及 操作 性 维护 。 

* 数据 库 规划 是 使 数据 库 系 统 开 发 生命 周期 各 阶段 尽 可 能 有 效 的 管理 活动 。 

“ 系统 定义 就 是 定义 数据 库 系统 的 范围 和 边界 ， 包括 主要 的 用 户 视图 。 用 户 视图 可 以 代表 
工作 角色 或 业务 应 用 领域 。 

“ 需求 的 收集 与 分 析 是 收集 和 分 析 数据 库 所 支持 的 公司 信息 ， 并 使 用 这 些 信息 标明 新 的 数 
据 库 系统 需求 的 过 程 。 

“处 理 多 用 户 视图 有 三 种 主要 方法 称 为 集中 式 方法 、 视 图 集成 方法 和 两 者 的 结合 。 集 中 式 
方法 包括 为 不 同 的 用 户 视图 收集 用 户 的 需求 ， 并 集中 到 一 个 需求 列表 中 ， 在 数据 座 设 计 
阶段 创建 一 个 代表 所 有 用 户 视图 的 数据 模型 。 视图 集成 方法 包括 将 对 每 个 用 户 视图 的 用 
户 需 求 作为 独立 的 需求 列表 。 创 建 代 表 每 个 用 户 视图 的 数据 模型 ， 并 在 数据 库 设 计 的 后 
续 阶段 进行 合并 。 

“数据库 设计 就 是 对 支持 公司 运行 和 目标 的 数据 库 系 统 进行 设计 的 过 程 。 这 个 阶段 包括 逻 
辑 数据 库 设计 和 物理 数据 库 设 计 两 部 分 。 

“ 选择 DBMS 的 目标 就 是 要 选择 一 个 系统 ， 可 以 满足 公司 目前 和 未 来 的 需求 ， 平衡 各 方面 
的 费用 ， 包 括 购买 DBMS 产 品 和 支持 数据 库 系统 的 其 他 软 /硬件 需求 ， 以 及 变更 与 培训 员 
工 的 费用 。 

* 应 用 程序 设计 是 对 用 户 界面 和 使 用 并 处 理 数 据 库 的 应 用 程序 序 的 设计 。 这 个 阶段 包括 两 项 
主要 任务 : 事务 设计 和 用 户 界面 设计 。 

* 构建 原型 就 是 构建 数据 库 系 统 的 工作 模型 ， 使 得 设计 者 或 用 户 可 以 直观 地 看 到 系统 和 评 
价 系统 。 
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“ 实现 是 数据 库 和 应 用 程序 设计 的 物理 实现 。 

“数据 转换 与 加 载 是 将 已 有 的 数据 转移 到 新 数据 库 中 ， 并 且 转 换 现 有 的 应 用 程序 在 新 数据 
库 上 运行 。 

* 测试 就 是 以 寻找 错误 为 目的 而 运行 数据 库 系 统 的 过 程 。 

“ 操作 性 维护 是 监视 和 维护 系统 安装 后 的 情况 的 过 程 。 


复习 题 


4.1 叙述 术语 “软件 危机 ”的 含义 。 

4.2 讨论 信息 系统 生命 周期 和 数据 库 系 统 开发 生命 周期 间 的 关系 。 

4.3 简要 叙述 数据 库 系 统 开发 生命 周期 的 各 个 阶段 。 

4.4 叙述 在 数据 库 规 划 阶 段 为 需求 的 数据 库 创 建 任务 陈述 和 任务 目标 的 目的 。 

4.5 讨论 在 设计 数据 库 系 统 时 用 户 视图 代表 什么 。 

4.6 比较 并 对 比 集中 式 方法 和 视图 集成 方法 在 管理 有 多 用 户 视图 的 数据 库 系 统 的 设计 上 
的 区 别 。 

4.7 解释 为 什么 在 开始 物理 数据 库 设 计 阶 段 之 前 选择 一 个 目标 DBMS 是 很 必要 的 。 

4.8 讨论 应 用 程序 设计 中 的 两 个 主要 活动 。 

4.9 讨论 开发 数据 库 系统 原型 的 好 处 。 

4.10 讨论 实现 阶段 的 主要 活动 。 

4.11 叙述 数据 转换 和 加 载 阶段 的 目的 。 

4.12 解释 测试 数据 库 系 统 的 目的 。 

4.13 操作 性 维护 阶段 的 主要 活动 是 什么 ? 
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本 章 主题 : 

。 数 据 管理 和 数据 库 管 理 的 区 别 。 

。 数 据 管理 和 数据 库 管理 的 目标 和 主要 工作 。 

。 数 据 库 安全 性 的 范畴 。 

。 为 什么 数据 库 安全 是 企业 主要 关心 的 问题 。 

。 可 能 影响 数据 库 系 统 的 威胁 类 型 。 

。 如 何 使 用 基于 计算 机 的 控制 方法 来 保护 数据 库 系统 。 

在 第 4 章 ， 我 们 已 经 学 习 了 数据 库 系统 开发 生命 周期 的 主要 阶段 。 在 本 章 中 ,我们 将 讨论 
数据 管理 员 (DA) 和 数据 库 管理 员 (DBA) 的 作用 ， 以 及 它们 与 数据 库 系统 开发 生命 周期 的 
各 阶段 的 关系 。DA 和 DBA 的 一 个 重要 工作 就 是 保证 数据 库 的 安全 。 我 们 还 将 讨论 数据 库 系 统 
面临 的 潜在 威胁 ， 以 及 为 了 将 这 些 威胁 所 带 来 的 危害 最 小 化 而 使 用 的 基于 计算 机 的 一 些 对 策 。 


5.1 数据 管理 和 数据 库 管 理 


数据 管理 员 (DA) 和 数据 库 管理 员 (DBA) 分 别 负责 有 关 企 业 数据 和 企业 数据 库 活动 的 
管理 和 控制 ，DA 更 关心 数据 库 生命 周期 的 早期 阶段 ， 从 规划 到 逻辑 数据 库 设计 。 而 DBA 则 更 
关心 后 期 的 工作 ， 从 应 用 程序 和 物理 数据 库 设 计 到 数据 库 的 运作 维护 等 。 根 据 企业 组 织 机 构 
和 数据 库 系 统 的 规模 和 复杂 性 ，DA 和 DBA 可 以 由 一 人 或 多 人 来 担任 。 我 们 首先 讨论 在 一 个 企 
业 中 ，DA 和 DBA 的 目标 和 具体 的 工作 。 


5.1.1 数据 管理 


数据 管理 (Data Administration) ”对 企业 数据 的 管理 和 控制 ， 包 括 数据 库 规 划 、 标 


准 的 开发 和 维护 、 策 略 和 过 程 以 及 逻辑 数据 库 设 计 。 


DA 负责 管理 企业 数据 ， 包 括 非 计算 机 处 理 的 数据 ， 实 际 上 ， 还 需要 常常 关注 那些 由 企业 
用 户 或 业务 应 用 领域 共享 的 数据 的 管理 。DA 的 关键 责任 包括 为 高 层 管理 者 提供 建议 和 意见 ， 
确保 数据 库 技术 的 应 用 能 够 支持 公司 目标 。 在 有 些 企业 中 ， 数 据 管 理 作为 一 个 专门 的 业务 领 
域 而 存在 ， 而 在 另 一 些 企业 中 ， 则 将 它 归 人 到 数据 库 管理 中 。 数 据 管理 的 有 关 工 作 在 表 5-1 进 
行 了 详细 描述 。 





表 5-1 ”数据 管理 工作 










选择 合适 的 生产 工具 
协助 公司 IMIS 的 开发 和 制定 商业 策略 
进行 可 行 性 研究 并 规划 数据 库 的 开发 
开发 一 个 企业 数据 模型 

确定 企业 组 织 机 构 的 数据 需要 


设 定数 据 采集 的 标准 、 建 立 数据 格式 
估计 数据 量 及 可 能 的 增长 速度 
确定 数据 使 用 的 方式 和 频率 
确定 数据 访问 要 求 ， 并 为 合法 要 求 以 及 企 
业 要 求 提供 保障 
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管理 数据 字典 

保持 与 最 终 用 户 和 数据 管理 人 员 的 联系 ， 以 
全 定 新 要 求 并 解决 数据 访问 或 性 能 方面 的 问题 
开发 一 个 安全 策略 


承担 逻辑 数据 库 设 计 

和 数据 库 管 理 人 员 、 应 用 程序 开发 者 保持 
联系 、 以 人 确保 应 用 程序 能 满足 所 有 人 的 楼 求 
为 用 户 提 供 数 据 标准 和 相应 责任 的 培训 
保持 数据 与 ITIS 和 业务 开发 一 致 

确保 文档 完整 性 ,包括 企业 的 数据 模型 、 
标准 、 策 略 、 程 序 和 和 最终 用 户 的 控制 





5.1.2 数据 库 管 理 


数据 库 管 理 (Database Administration) ”企业 数据 库 系 统 的 管理 和 控制 ， 包 括 数据 库 


物理 设计 与 实现 、 设 置 安全 性 和 完整 性 控制 、 监 挖 系统 性 能 以 及 在 必要 时 重组 数据 库 。 





DBA 比 DA 更 面向 技术 ， 要 求 懂得 很 多 有 关 DBMS 和 操作 系统 环境 的 知识 ， 他 的 主要 职责 
是 最 大 程度 地 使 用 DBMS 软 件 来 开发 和 维护 系统 。 数 据 库 管理 的 具体 工作 在 表 5-2 中 进行 了 详 
细 描 述 。 


表 5-2 数据 库 管理 工作 















评估 和 选择 DBMS 产 品 监控 系统 性 能 ， 适当 地 调整 数据 库 


实现 物理 数据 库 的 设计 实现 数据 库 的 定时 备份 

用 目标 DBMS 来 实现 物理 数据 库 的 设计 确保 恢复 机 制 和 程序 的 合适 性 

定义 安全 性 和 完整 性 约束 确保 文档 的 完整 性 ， 包 括 内 部 产生 的 资料 
与 数据 库 系 统 开发 者 保持 联系 保持 与 软 硬 件 开发 和 费用 同步 发 展 ， 在 必 
人 确定 测试 策略 要 时 更 新 设备 配置 

培训 用 户 


负责 停止 运作 已 经 实现 了 的 数据 库 系统 
5.1.3 数据 管理 与 数据 库 管理 的 比较 


前 面 几 节 讨论 了 数据 管理 和 数据 库 管 理 的 目标 和 具体 工作 ， 表 5-3 总 结 了 数据 管理 和 数据 
库 管 理 的 主要 工作 的 不 同 之 处 。 可 能 最 明显 的 区 别 在 于 工作 的 本 质 不 同 ，DA 的 工作 往往 具 管 
理性 ， 而 DBA 的 工作 则 更 具 技 术 性 。 


表 5-3 ”数据 管理 和 数据 库 管理 一 一 主要 工作 的 区 别 
和 





数据 管理 数据 库 管理 

关注 战略 上 的 IS 规 划 评估 新 的 DBMS 

人 确定 长 期 的 目标 执行 规划 来 实现 当前 目标 

确定 标准 、 策 略 和 程序 执行 标准 、 策 略 和 程序 
- 确定 数据 要 求 实现 数据 需求 

开发 逻辑 数据 库 开发 物理 数据 库 

开发 和 维护 企业 数据 模型 实现 物理 数据 库 的 设计 

调整 数据 库 的 发 展 监控 、 控 制 数 据 库 的 使 用 

面向 管理 的 面向 技术 的 


DBMS 独 立 性 依赖 于 DBMS 
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5.2 数据 库 安全 性 
在 这 一 节 ， 我 们 将 讲述 数据 库 安全 性 的 范畴 ， 并 讨论 为 什么 企业 要 认真 对 待 会 给 它们 的 

数据 库 系统 带 来 潜在 威胁 的 事 。 同 时 还 确定 了 威胁 安全 性 的 范围 和 它们 对 数据 库 系 统 造成 的 

影响 。 

数据 库 安全 性 (Database Security) 保护 数据 库 系统 免 受 有 意 的 和 意外 的 威胁 的 机 制 。 


安全 性 考虑 不 仅仅 针对 数据 库 中 保存 的 数据 ， 安 全 漏洞 还 可 能 影响 系统 的 其 他 部 分 ， 进 
而 可 能 威胁 整个 系统 。 所 以 ， 数 据 库 安全 性 包含 硬件 、 软 件 、 人 和 数据 等 。 为 了 有 效 地 实 
现 数据 库 安全 ， 需 要 为 系统 的 每 个 具体 任务 都 定义 适当 的 控制 。 安 全 性 的 必要 性 在 过 去 往 
往 被 忽视 或 忽略 ， 但 现在 已 经 越 来 越 受 到 各 企业 的 重视 。 这 种 改变 源 于 存储 在 计算 机 中 的 
重要 的 企业 数据 的 增长 ， 而 且 人 人们 认识 到 这 类 数据 的 丢失 和 不 能 使 用 都 将 引起 潜在 的 灾难 

一 个 数据 库 代表 一 个 可 以 使 用 合适 的 控制 手段 来 确保 安全 的 重要 的 企业 资源 。 我 们 认为 
数据 库 的 安全 性 与 如 下 情况 有 关 : 

“ 窃取 和 欺骗 

“机 密 〈 秘 密 ) 的 被 窒 

“ 隐私 的 被 窃 

“完整 性 的 丢失 

“失去 有 效 性 

这 几 点 代表 了 一 个 组 织 应 该 关注 的 可 以 减少 危险 的 一 些 领域 ， 这 里 的 危险 是 指 发 生 于 失 
和 破坏 的 可 能 性 。 在 某 些 情况 下 ， 这 些 结果 联系 得 极为 紧密 以 至 于 在 一 种 情况 下 会 引起 数据 
于 撩 的 活动 也 可 能 引起 另 一 种 情况 下 数据 的 丢失 。 而 且 ， 欺 骗 和 隐私 的 被 穿 在 有 意 和 无 总 扣 
作 中 都 可 能 产生 ， 并 且 不 一 定 需 要 对 数据 库 或 计算 机 系统 进行 可 觉察 的 改变 ， 

徐 取 和 坎 骗 不 仅 影响 数据 库 环 境 ， 也 会 影响 整个 企业 的 运作 ， 因 为 进行 这 类 犯罪 的 人 
通常 关心 的 是 减少 这 类 事情 发 生 的 机 会 。 窃 取 和 炊 蝙 不 一 定 需要 修改 数据 ， 也 可 能 是 会 引起 
机 密 和 隐私 被 窃 的 活动 。 

机 密 指 的 是 需要 在 数据 上 维护 保密 ， 通 常 只 包含 那些 对 组 织 来 说 至 关 重 要 的 数据 但是、 
得 私 指 的 是 需要 保护 的 关于 个 人 的 数据 。 例 如 ， 存 在 可 能 导致 机 密 于 失 的 安全 漏洞 会 使 个 业 
素 失 竞争 力 ， 隐 私 的 丢失 可 能 会 导致 不 利于 企业 的 一 些 行为 的 执行 。 

数据 完整 性 的 丢失 将 导致 数据 无 效 和 混乱 ， 这 可 能 会 严重 影响 整个 组 织 的 运作 。 很 多 企 
风笛 在 都 在 试图 提供 永 不 间断 的 操作 ， 即 称 为 24 x 7 可 用 性 ( 即 ， 一 天 24 小 时 ， 一 周 7 天 )。 系 
竺 个 可 用 意味 着 数据 或 系统 (或 者 两 者 ) 无 法 被 访问 ， 这 会 严重 影响 一 个 组 织 的 运作 。 丰 其 
华 情况 下 ， 引 起 一 个 系统 不 可 用 的 事件 也 可 能 会 引起 数据 的 破坏 . 

靠近， 基于 计算 机 的 犯罪 活动 显著 增加 ， 而 且 预 计 在 未 来 的 几 年 里 将 会 继续 增加 。 数 据 库 安 
全 全 的 目标 就 是 ， 在 不 过 度 限制 用 户 的 前 担 下， 通过 性 价 比较 高 的 方式 将 有 可 能 导致 于 失 的 事 人 
出 现 的 概率 降 到 最 小 。 


5.2.1 安全 威胁 











威胁 (Threat) 任何 可 能 破坏 系统 并 进而 破坏 企业 的 有 意 或 无 意 的 情况 或 事件 、 
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安全 威胁 可 能 是 由 关系 到 一 个 人 、 一 次 行动 或 可 能 对 企业 有 害 的 环境 的 一 种 情况 或 一 个 事 
件 引 起 的 。 它 可 能 会 引起 一 个 企业 有 形 的 损失 ， 比 如 硬件 、 软 件 或 数据 的 丢失 ， 也 有 可 能 引起 
无 形 的 损失 ,如 信誉 或 客户 信任 的 损失 。 任何 一 个 企业 都 面临 识别 所 有 可 能 的 安全 威胁 的 问题 。 
所 以 一 个 企业 至 少 应 访 投 入 一 些 时 间 和 精力 去 识别 出 大 多 数 严重 的 威胁 。 

在 前 几 节 中 ， 我 们 已 经 指出 了 一 些 通过 有 意 的 和 无 意 的 活动 引起 的 安全 威胁 。 有 一 些 威 
胁 可 能 是 有 意 的 ， 而 有 一 些 威胁 是 无 意 的 ， 但 它们 的 影响 是 一 样 的 。 有 意 的 威胁 通常 与 人 有 
关 ， 授 权 用 户 与 非 授权 用 户 (有 些 可 能 是 企业 以 外 的 人 员 ) 都 可 能 造成 这 种 威胁 。 

任何 一 种 威胁 都 必须 看 成 是 安全 上 的 漏洞 ， 如 果 忽 视 这 些 漏洞 就 会 给 企业 带 来 不 利 的 影 
响 。 表 5-4 列 出 了 各 类 威胁 的 例子 和 可 能 给 企业 带 来 的 后 果 。 例 如 ,“ 利 用 其 他 人 的 方式 访问 ” 
可 能 引起 企业 数据 被 窃取 和 欺骗、 机 密 的 丢失 、 隐 私 的 丢失 等 。 

一 个 企业 遭 到 威胁 而 引起 的 后 果 的 程度 取决 于 很 多 因素 ， 诸 如 是 否 有 相应 的 对 策 和 应 急 
计划 等 。 例 如 ， 如 果 硬 件 出 现 故障 破坏 了 二 级 存储 ， 那 么 在 问题 被 解决 之 前 要 终止 一 切 活动 。 
恢复 也 取决 于 很 多 因素 ， 包 括 最 后 一 次 备份 是 在 何 时 进行 的 以 及 恢复 系统 所 需要 的 时 间 。 

一 个 企业 要 能 够 识别 各 类 可 能 会 遇 到 的 威胁 ， 并 启动 合适 的 计划 和 对 策 ， 同 时 我 们 也 需 
要 考虑 实现 它们 的 成 本 。 很 明显 ， 把 大 量 的 时 间 、 精 力 和 人 金钱 投入 在 - 些 发 生机 率 很 小 的 潜 
在 威胁 上 是 不 划算 的 。 企 业 的 商业 性 质 也 会 影响 到 它 需 要 考虑 的 威胁 的 种 类 ， 有 一 些 威胁 可 
能 是 非常 罕见 的 。 但 是 ， 罕 见 事件 也 需要 被 考虑 进来 ， 尤 其 是 当 它 们 的 破坏 力 很 大 时 。 图 5-1 
显示 了 对 计算 机 系统 的 潜在 威胁 的 总 结 。 

表 5-4 威胁 安全 的 例子 和 可 能 产生 的 结果 
窃取 和 机 密 性 秘密 的 完整 性 有 效 性 
欺骗 的 丢失 丢失 的 丢失 的 丢失 
.利用 其 他 人 的 方式 访问 Vv Vv vV 
林 授 权 的 数据 修改 或 备份 v Vv 
程序 的 修改 Vv V Vv 
安全 策略 和 程序 不 合理 
允许 机 密 数据 和 普通 数据 混合 输出 
在 线路 上 窃听 


V Vv Vv 
Vv Vv Vv 
黑客 的 非法 入侵 Vv Vv Vv 
勒索 Vv Vv Vv 
Vv vV Vv 
Vv Vv Vv 
VV ye VV 





威胁 


创建 系统 的 漏洞 。 

窃取 数据 、 程 序 和 设备 

安全 机 制 失败 ， 授 于 过 高 的 访问 权 
员工 短缺 或 罢工 v v 
员工 培训 不 到 位 | 
浏览 或 透露 未 授权 的 数据 v 
电子 干扰 和 辐射 | v v 
断 电 带 来 的 数据 损坏 v v 
火灾 (电器 故障 、 照 明 故 障 、 纵 火 ) 
洪水 、 爆 炸 

对 设备 的 物理 破坏 

电 绕 断 接 

病毒 入侵 

”| 


< < 
< < 
< 
< 


《人 << 
《< 
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硬件 

。 火 灾 / 洪 水 /爆炸 DBMS 和 应 用 软件 

。 由 于 断 电 或 振荡 引起 的 数据 破坏 。 授 予 过 高 的 访问 权 ， 安 全 机 制 
* 由 于 授予 过 大 的 访问 权限 而 使 安 失败 

* 对 设备 的 物理 破坏 





* 电子 干扰 或 辐射 





通信 网 络 数据 库 

。 线 路 故障 “未 授权 的 数据 修改 或 备份 

。 电缆 断 接 “数据 被 窃 加 

.电子 干扰 或 辐射 * 由 于 断 电 或 振荡 引起 的 数据 损坏 
ER 程序 员 / 操 作 员 
“利用 别人 的 访问 方式 访问 。 创建 系统 漏洞 spt 
“ 浏览 或 和 器 未 授权 的 数据 “程序 的 修改 (如 新 建 一 个 不 可 靠 的 软件 ) 。 “安全 策略 和 程序 不 合理 
“二 和 汪 种 信 “员工 培训 不 到 位 
“十 的 扑 沪 人 保 “安全 策略 和 程序 不 合理 
ne * 员工 短缺 或 罢工 


“ 病毒 人 侵 
图 5-1 计算 机 系统 的 潜在 威胁 


5.2.2 ”对策 一 -基于 计算 机 的 控制 


针对 数据 库 系 统 威胁 的 对 策 种 类 有 从 物理 控制 到 管理 规程 的 各 种 手段 。 尽管 基于 计算 机 
的 控制 是 可 行 的 ， 但 值得 注意 的 是 ， 一 般 来 说 DBMS 的 安全 性 和 操作 系统 的 安全 性 相当 ， 因 
为 它们 需要 紧密 的 合作 。 图 5-2 显 示 了 典型 的 多 用 户 计 算 机 环境 。 在 这 一 节 ， 我 们 集中 讨论 下 
列 用 于 多 用 户 环 境 的 基于 计算 机 的 安全 控制 (有 些 措施 在 PC 机 上 可 能 没 法 实现 )。 

“授权 

。 视 图 

。 备 份 和 恢复 

。 完 整 性 

* 加 密 

* 元 余 磁盘 阵列 (RAID) 

1. 授权 


授权 (Authorization) 。 授予 权限 和 权利 使 用 户 只 能 在 合法 的 权限 范围 内 访问 数据 库 


系统 和 数据 库 系 统 对 象 。 
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授权 控制 可 以 构建 在 软件 中 ， 不 仅 能 够 控制 某 个 用 户 可 以 访问 的 数据 库 系统 和 系统 中 的 
对 象 ， 而且 也 可 以 控制 用 户 进 行 的 操作 。 由 于 这 个 原因 ， 授权 控制 有 时 指 的 是 访问 控制 。 授 
权 的 过 程 包括 对 要 求 访问 客体 的 主体 的 认证 ,“ 主 体 ” 代 表 一 个 用 户 或 程序 ， 而 “客体 ” 则 代 


外 部 网 的 不 可 靠 性 
(如 因特网 ) 








远程 客户 端 


DBMS 服 务 器 
授权 和 访问 






2. 认证 





认证 (Authentication ) 确定 一 个 用 户 是 否 是 如 他 (她 ) 声称 的 合法 用 户 的 机 制 。 


系统 管理 员 通 常 需要 负责 创建 每 个 用 户 的 账号 ， 来 管理 用 户 访问 计算 机 系统 的 权限 。 每 位 用 户 
将 得 到 独一无二 的 身份 ， 操 作 系 统 利用 它 来 确定 该 用 户 是 谁 。 和 每 个 身份 相关 联 的 是 一 个 密码 ， 密 
码 由 用 户 指定 并 对 操作 系统 来 说 是 可 见 的 ， 该 密码 使 得 操作 系统 可 以 认证 该 用 户 是 谁 。 

这 个 过 程 允许 得 到 认证 的 用 户 访问 计算 机 系统 ， 但 并 不 一 定 拥有 访问 DBMS 和 相关 应 用 
程序 的 权利 。 需 要 另外 一 个 与 之 相似 的 过 程 来 给 用 户 授予 使 用 DBMS 的 权限 。 授 予 使 用 DBMS 
的 权限 的 任务 通常 由 DBA 实 现 ， 它 能 在 DBMS 中 创建 每 个 用 户 的 账号 和 密码 。 

有 些 DBMS 维 护 一 个 有 效用 户 身份 和 相关 的 密码 列表 ， 它 与 操作 系统 的 有 关 列 表 不 同 。 
然而 ， 有 些 DBMS 维 护 一 张 列表 ， 此 列表 中 的 数据 项 基于 当前 用 户 登 录 账 号 标识 符 与 操作 系 
统 中 的 用 户 列表 中 的 数据 项 对 应 ， 当 用 户 已 经 用 一 个 名 字 登 录 操作 系统 时 这 防止 了 同一 个 
用 户 用 另 一 个 名 字 登 录 到 DBMS.。 

(1) 权限 

一 县 一 个 用 户 被 允许 使 用 DBMS ， 可 能 会 自动 得 到 各 种 其 他 的 权限 。 例 如 ， 拥有 访问 或 
创建 某 些 数据 库 对 象 (如 表 、 视 图 和 索引 ) 的 权限 ， 或 者 拥有 运行 各 种 DBMS 工 具 的 权限 。 
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给 用 户 授予 权限 可 以 保证 他 们 完成 其 工作 任务 。 由 于 过 多 的 授予 不 必要 的 权限 会 危及 系统 的 
安全 ， 因 此 只 有 当 该 权限 是 完成 用 户 工作 所 必需 的 时 ， 才 授予 他 (或 她 ) 该 权限 。 

(2) 拥有 权 和 权限 

DBMS 中 的 某 些 对 象 是 DBMS 本 身 拥 有 的 ， 通 常 以 特殊 的 超级 用 户 的 形式 出 现 ， 比 如 
DBA。 相 应 的 ， 对 象 的 拥有 者 具有 所 拥有 对 象 的 全 部 权限 。 如 果 其 他 被 授权 用 户 拥有 对 象 ， 
情况 也 是 如 此 。 对 象 的 创建 者 拥有 该 对 象 ， 而 且 可 以 将 该 对 象 的 合适 权限 授予 其 他 用 户 。 例 
如 ， 尽 管 一 个 用 户 拥有 一 个 视图 ， 但 是 他 (或 她 ) 可 能 只 拥有 查询 该 视图 的 权限 ， 这 种 情况 
发 生 在 该 用 户 只 能 查询 该 视图 所 基于 的 基本 表 的 情况 下 。 权 限 可 以 传递 给 其 他 用 户 。 例 如 ， 
一 些 表 的 拥有 者 可 以 授权 其 他 用 户 查 询 这 些 表 ， 但 是 却 不 能 更 新 这 些 表 。 

当 DBMS 支 持 各 种 不 同类 型 的 授权 标识 符 时 ， 那 么 每 种 类 型 具有 不 同 的 优先 权 。 例 如 ， 一 
个 DBMS 可 能 既 允 许 创建 用 户 标 识 符 也 允许 创建 组 用 户 标识 符 ， 单 用 户 标识 符 的 优先 级 高 于 组 
用 户 标识 符 。 对 于 这 样 的 DBMS， 用 户 标识 符 和 组 标识 符 可 以 定义 成 表 5-5a 和 表 5-5b 的 形式 .。 


表 5-5 
a) 用 户 标 识 符 b) 组 标识 符 
用 户 标识 符 类 型 组 成 员 标 识 符 
S0099 User Sales S0099 
S2345 User Sales S2345 
S1500 User 
Sales Group 





在 表 5-5a 中 ， 列 名 为 用 户 标 识 符 (User Identifier) 和 类 型 (Type) 的 列 列 出 了 系统 中 的 
每 个 用 户 以 及 他 们 的 用 户 类 型 ， 类 型 用 于 区 分 单个 用 户 和 组 用 户 。 在 表 5-5b 中 ， 列 名 为 组 
(Group) 和 成 员 标识 符 (Member Identifier) 的 列 列 出 了 每 个 组 和 该 组 中 包含 的 用 户 成 员 。 根 
据 具体 的 标识 符 授予 一 定 的 权限 ， 标 识 符 指明 了 特定 数据 库 对 象 所 具备 的 权限 种 类 (如 查询 、 
更 新 、 插 入 、 删 除 或 者 全 部 ) 。 

在 有 些 DBMS 中 ， 用 户 需要 告诉 系统 他 运行 在 哪个 标识 符 下 ， 尤 其 是 当 该 用 户 属于 多 个 
组 时 。 这 在 熟悉 了 DBMS 提 供 的 认证 与 其 他 控制 机 制 的 时 候 就 显得 特别 重要 ， 尤 其 是 在 权限 
被 应 用 到 多 个 授权 标识 符 时 ， 或 是 权限 可 以 被 传递 时 。 这 样 便 可 以 基于 用 户 的 需求 以 及 他 们 
需要 使 用 的 应 用 程序 来 授予 正确 的 权限 。 

3. 视图 





视图 (View) 





一 个 虚拟 表 ， 它 不 一 定 在 数据 库 中 存在 ， 但 可 以 在 某 个 用 户 提出 要 求 时 产生 。 





视图 机 制 通过 对 特定 用 户 隐 藏 部 分 数据 库 信 息 而 提供 了 强大 且 灵 活 的 安全 机 制 。 用 户 不 
知道 任何 在 表 中 存在 而 在 视图 中 不 可 见 的 列 和 行 。 视 图 可 以 建立 在 多 张 表 上 ， 用 户 将 被 授予 
使 用 该 视图 的 适当 的 权限 ， 但 是 不 能 使 用 基本 表 。 这 样 ， 使 用 视图 比 简单 地 给 用 户 授予 使 用 
基本 表 的 权限 更 好 。 

4. 备份 和 恢复 





备份 (Backup) ”在 脱 机 存储 介质 上 ， 周 期 性 地 存储 一 个 数据 库 的 副本 和 日 志文 件 


(还 有 可 能 包含 程序 ) 的 过 程 。 
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为 了 保证 在 系统 出 现 故障 时 能 够 恢复 数据 库 ，DBMS 需 要 提供 备份 工具 。 为 了 跟踪 数据 
库 事务 ，DBMS 还 包含 了 一 个 特殊 文件 叫做 日 志文 件 (或 日 记 )， 日 志文 件 主要 包括 所 有 更 改 
数据 库 的 信息 。 建 议定 期 备份 数据 库 副 本 和 日 志文 件 ， 并 且 保 证 备份 保存 在 可 靠 的 地 方 。 当 
发 生 故 障 导 至 数据库 不 可 用 时 ， 备 份 的 副本 和 日 志文 件 中 包括 的 详细 信息 可 以 将 数据 库 恢复 
到 最 近 的 一 致 性 状态 。 


日 记 (Journaling) ”保存 和 维护 记录 了 所 有 对 数据 库 进行 的 修改 的 日 志文 件 的 过 程 ， 


当 事 件 执行 失败 时 能 够 有 效 地 用 于 恢复 数据 库 。 


为 对 恢复 过 程 提 供 支持 ，DBMS 需 要 提供 日 志 工 具 (有 时 称 为 日 记 )， 它 记录 了 事务 和 数 
据 库 的 当前 状态 。 日 志文 件 的 优势 在 于 ， 当 故障 发 生 时 ， 通 过 使 用 数据 库 的 备份 副本 和 日 志 
文件 中 包含 的 详细 信息 ， 数 据 库 可 以 被 恢复 到 最 近 的 一 致 性 状态 。 如 果 在 故障 发 生 时 没有 日 
志文 件 ， 那 么 唯一 可 以 使 用 的 恢复 方式 就 是 使 用 最 新 的 数据 库 备 份 副本 来 恢复 数据 库 。 但 是 ， 
如 果 没 有 日 志文 件 ， 在 数据 库 备份 之 后 对 数据 库 所 作 的 任何 修改 都 将 丢失 。 

5. 完整 性 

完整 性 约束 通过 限制 无 效 数据 的 进入 以 免得 出 令 人 误解 的 或 不 正确 的 结果 来 维护 数据 
库 系统 的 安全 。 完 整 性 约束 在 1.3 节 已 经 作 了 介绍 ， 并 且 我 们 将 在 第 10 章 的 步骤 2.4 中 进一步 
讨论 。 

6. 加 密 





加 密 (Encryption) ”用 一 种 特殊 的 算法 对 数据 进行 编码 ， 使 在 没有 密 钥 的 情况 下 数 





据 不 会 被 任何 一 个 程序 读 取 。 


如 果 一 个 数据 库 系 统 存储 了 非常 敏感 的 数据 ， 那 就 需要 进行 预先 编码 以 防 可 能 出 现 的 外 
部 威胁 或 企图 访问 该 数据 的 一 些 操作 。 有 些 DBMS 提 供 了 一 套 加 密 工 具 。 尽 管 由 于 解密 需要 
时 间 会 降低 系统 的 性 能 ， 但 DBMS 可 以 访问 这 些 数据 (在 解码 后 )。 加 密 还 保护 了 在 通信 线路 
上 传输 的 数据 。 目 前 有 很 多 技术 可 以 用 于 加 密 数 据 以 隐藏 信息 ， 有 些 是 不 可 逆转 的 而 有 一 些 
是 可 逆转 的 。 不 可 逆转 技术 ， 顾 名 思 义 ， 它 不 允许 原 数据 可 见 ， 但 是 ， 可 以 使 用 这 些 数 据 获 
得 有 效 的 统计 信息 。 可 逆转 的 技术 使 用 的 非常 广泛 。 为 了 在 网 络 中 安全 的 传输 数据 ， 要 求 使 
用 密码 系统 ， 密 码 系统 中 包括 以 下 内 容 : 

“ 用 密 钥 加 密 数 据 ( 明文 )。 . 

* 加 密 算法 ， 用 加 密 密 钥 将 明文 转 成 密 文 。 

“ 用 解密 密 钥 将 密 文 解码 。 

* 解密 算法 ， 用 解密 密 钥 将 密 文 转 成 明文 。 

有 一 种 称 为 “对 称 加 密 ” 的 技术 ， 在 加 密 和 解密 都 使 用 同一 个 密 钥 ， 所 以 它 的 安全 性 依 
赖 于 交换 密 钥 时 的 通信 线路 的 安全 程度 。 但 是 ， 大 多 数 用 户 无 法 得 到 可 靠 的 通信 线路 ， 而 且 
为 了 确保 可 靠 性 ， 要 求 密 钥 长 度 同 消息 一 样 。 但 是 ， 大 多 数 系统 都 是 基于 短 于 信息 的 密 钥 运 
作 的 。 一 种 叫做 DES (数据 加 密 标准 ) 的 加 密 规 则 是 IBM 开 发 的 标准 加 密 算法 。 该 规则 中 加 
密 和 解密 使 用 一 个 密 钥 ， 该 密 钥 必 须 是 保密 的 ， 尽 管 算法 是 公开 的 。 该 算法 将 明文 的 每 64 位 
大 小 的 信息 块 使 用 56 位 的 密 钥 进行 转换 。DES 并 不 被 认为 是 非常 可 靠 的 ， 有 些 作者 还 坚持 说 
需要 更 大 的 密 钥 ， 例 如 ， 一 种 被 称 为 PGP (完好 加 密 ) 的 规则 使 用 128 字 节 的 对 称 算法 为 其 传 
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递 的 数据 加 密 。 

现在 使 用 特殊 的 硬件 可 以 破解 64 位 的 密 钥 ， 当 然 也 要 付出 一 些 代价 。 但 是 ， 该 技术 将 在 
几 年 之 内 就 会 被 大 家 掌握 。 我 们 还 需要 正视 一 个 现实 ， 即 在 不 久 的 将 来 80 位 的 密 钥 也 将 被 破 
解 ， 只 有 128 位 的 密 钥 还 不 会 被 破解 。“ 强 认证 ”和 “ 弱 认证 ”有 时 用 来 区 分 以 现 有 的 技术 和 
知识 都 无 法 被 破解 的 算法 和 一 些 会 被 破解 的 算法 。 

另 _ 种 密 各 系统 为 加 密 和 解密 使 用 不 同 的 密 钥 ， 这 称 为 “不 对 称 加 密 法 "。 公 开 密 钥 系统 
就 是 其 中 的 一 个 实例 ， 它 包含 两 个 密 钥 ， 一 个 是 公开 的 ， 另 一 个 是 私有 的 。 加 密 算法 也 是 公 
开 的 。 所 以 如 果 一 个 人 想 给 用 户 发 消息 ， 都 可 以 使 用 对 方 的 公开 密 钥 结合 算法 来 加 窗 。 只 有 
私有 密 钥 的 拥有 者 才能 解密 该 消息 。 公 开 密 钥 系统 还 可 以 随 消息 发 送 一 个 “数字 签名 ， 证 明 
这 个 消息 是 来 自 于 声称 发 该 消息 的 人 。 最 著名 的 不 对 称 加 密 算 法 是 RSA， 该 名 字 是 由 发 明 该 
算法 的 三 位 发 明 者 的 名 字 的 首 字 母 组 成 。 

一 般 来 说 ， 对 称 算法 比 非 对 称 算法 在 计算 机 中 的 执行 速度 更 快 ， 但 是 ， 在 实际 应 用 中 ， 
我 们 常常 结合 使 用 这 两 种 方法 。 即 用 公开 密 钥 算法 加 密 一 个 随机 产生 的 密 钥 ， 该 密 钥 又 用 来 
加 密 对 称 算 法 加 密 的 实际 信息 。 

7. 宛 余 磁 盘 阵 列 (RAID ) 

运行 DBMS 的 硬件 必须 是 能 够 容错 的 ， 也 就 是 说 即使 硬件 的 某 个 部 分 出 现 了 故障 ，DBMS 
仍 能 够 继续 操作 。 这 说 明 需 要 有 能 够 无 颖 地 集成 到 工作 系统 中 的 完 余 组 件 ， 当 一 个 和 多 个 组 
件 出 现 问题 时 ， 可 以 利用 这 些 宛 余 组 件 。 能 够 容错 的 主要 的 硬件 组 成 部 分 包括 磁盘 驱动 器 、 
磁盘 控制 器 、CPU、 电 源 和 风扇 。 磁 盘 驱 动 器 是 最 易 受 攻击 的 组 件 ， 因 为 它 引起 故障 的 时 间 
比 其 他 硬件 组 件 都 短 。 

一 种 解决 方案 是 采用 宛 余 磁 盘 阵 列 (RAID) 技术 ，RAID 拥 有 由 一 组 独立 的 磁盘 阵列 组 
成 的 大 磁盘 阵列 ， 使 用 它 可 以 提高 可 靠 性 ， 有 时 候 还 会 提高 性 能 。 


5.3 本 章 小 结 


。 数 据 管理 是 对 企业 数据 的 管理 和 控制 ， 包 括 数据 库 规划 、 开 发 和 维护 标准 、 策 略 和 过 程 
以 及 逻辑 数据 库 的 设计 。 

。 数据库 管理 是 对 企业 数据 库 系 统 的 管理 、 控 制 ， 包 括 物 理 数 据 库 设计 与 实现 、 设 置 安全 
性 和 完整 性 控制 监控 系统 性 能 以 及 在 必要 时 重组 数据 库 。 

。 数 据 库 安 全 性 就 是 有 关 保 护 数据 库 系统 免 受 有 意 和 无 意 威胁 的 机 制 。 

。 安 全 威胁 就 是 可 能 破坏 系统 并 进而 影响 企业 的 有 意 的 和 无 意 的 任何 情况 和 事件 。 

。 用 于 多 用 户 环境 的 基于 计算 机 的 安全 控制 包括 : 授权 、 视 图 、 备 份 和 恢复 、 完 整 性 、 加 
密 和 元 余 磁 盘 阵列 。 

。 授 权 就 是 授予 权利 和 权限 使 得 用 户 能 够 合法 地 访问 数据 库 系 统 和 访问 数据 库 系 统 对 象 。 
。 认 证 就 是 用 来 确定 一 个 用 户 是 否 是 如 他 (她) 声称 的 合法 用 户 的 机 制 。 

。 视 图 是 一 个 虚拟 表 ， 它 不 一 定 在 数据 库 中 存在 ， 但 可 以 在 某 个 特定 用 户 提出 要 求 时 产生 。 

“备份 即 在 脱 机 的 存储 介质 上 ， 周 期 性 地 存储 一 个 数据 库 的 副本 和 日 志文 件 〈 也 可 能 包含 
程序 ) 的 过 程 。 

* 日 记 就 是 保存 和 维护 一 个 记录 了 所 有 对 数据 库 进行 的 修改 的 日 志文 件 的 过 程 ， 当 事件 执 
行 失败 时 能 够 用 它 恢复 数据 库 。 
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* 完整 性 约束 通过 限制 无 效 数据 的 进入 而 得 出 令 人 误解 的 或 不 正确 的 结果 来 维护 数据 库 系 
统 的 安全 。 
“ 加 密 就 是 用 一 种 特殊 的 算法 将 数据 编码 ， 这 样 在 没有 解码 的 情况 下 任何 一 个 程序 都 不 能 
读 取 数 据 。 
“ 元 余 磁 盘 阵 列 (RAID) 拥有 由 一 组 独立 的 磁盘 阵列 组 成 的 大 磁盘 阵列 ， 以 用 于 提高 可 
靠 性 ， 同 时 还 能 提高 性 能 。 
复习 题 
5.1 定义 数据 管理 和 数据 库 管理 的 目标 和 具体 工作 。 
5.2 比较 和 对 比 DA 和 DBA 负 责 的 主要 工作 。 
5.3 解释 数据 库 安全 性 的 目标 和 范畴 。 
5.4 列 出 可 能 影响 数据 库 系 统 的 安全 威胁 的 种 类 ， 并 讨论 每 一 种 威胁 可 能 给 企业 造成 的 影响 。 
5.5 解释 下 面 有 关 数 据 库 安全 的 术语 : 
(a) 授权 
(b) 视图 
(c) 备份 与 恢复 
(d) 完整 性 
(e) 加 密 
(f) RAID 
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第 6 章 事实 发 现 


本 章 主题 : 

“在 数据 库 系统 开发 生命 周期 中 何 时 要 用 到 事实 发 现 技 术 。 

* 在 整个 数据 库 系 统 生命 周期 中 收集 的 事实 类 型 。 

* 在 整个 数据 库 系 统 生 命 周 期 中 所 产生 的 文档 类 型 。 

最 泛 化 的 事实 发 现 技术 。 

* 如 何 使 用 每 一 种 事实 发 现 技术 ， 以 及 每 种 技术 的 优点 和 缺点 。 

* StayHome 录 像 出 租 公司 案例 研究 。 

* 怎样 把 事实 发 现 技术 运用 在 数据 库 系 统 开发 周期 的 早期 阶段 。 

在 第 4 章 ， 我 们 学 习 了 数据 库 系 统 开发 周期 的 各 个 阶段 。 在 这 些 阶 段 中 许多 情况 下 数据 库 
开发 者 必须 捕获 必要 的 事实 来 构建 数据 库 系统 。 这 些 事实 覆盖 业务 和 数据 库 系 统 用 户 ， 包 括 
术语 、 问 题 、 机 会 、 约 束 、 需 求 和 优先 权 。 这 些 事实 都 要 通过 事实 发 现 技术 来 捕获 。 


事实 发 现 (Fact-Finding) 运用 面谈 和 提问 等 技术 来 收集 有 关系 统 、 需求 和 用 户 喜 好 的 


形式 化 处 理 过 程 。 


这 一 章 , 我 们 讨论 什么 时 候 数据 库 开发 人 员 可 以 使 用 事实 发 现 技术 ， 以 及 必须 捕获 什么 类 
型 的 事实 。 我 们 简要 说 明了 怎样 利用 这 些 事实 来 产生 在 整个 数据 库 系统 开发 周期 中 所 要 使 用 的 
主要 的 文档 类 型 ， 并 描述 了 最 常 使 用 的 事实 发 现 技术 ， 以 及 它们 的 优点 和 缺点 。 最 后 我 们 将 以 
一 个 叫 StayHome 的 录像 出 租 公 司 为 例 ， 展示 如 何在 数据 库 系统 开发 过 程 的 早期 阶段 使 用 这 些 
技术 。 在 第 9 章 ~ 第 10 章 和 第 12 章 ~ 第 16 章 ， 我 们 将 用 这 个 实例 来 展示 数据 库 设 计 的 方法 学 。 

在 整个 这 一 章 中 ， 我 们 所 说 的 “数据 库 开发 人 员 ” 是 指 负 责 一 个 数据 库 系统 的 分 析 、 设 
计 和 实现 的 人 或 者 团体 。 


6.1 什么 时 候 使 用 事实 发 现 技术 


在 数据 库 应 用 开发 过 程 中 ,许多 情况 下 都 要 用 到 事实 发 现 技术 。 然 而 ， 事实 发 现 技术 在 
生命 周期 的 早期 ， 包 括 数 据 库 规划 、 系 统 定义 、 需 求 收集 和 分 析 阶段 ， 都 是 非常 关键 的 。 正 
是 在 这 些 早期 阶段 ， 开 发 人 员 要 了 解 术 语 、 问 题 、 机 会 、 约 束 ， 需求 以 及 业务 和 系统 用 户 的 
优先 级 。 事 实 发 现在 数据 库 设 计 以 及 以 后 的 阶段 中 也 要 用 到 ， 但 使 用 的 范围 要 小 一 些 。 例 如 ， 
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在 物理 数据 库 设 计 阶段 ， 当 开发 人 员 想 要 更 多 地 了 解 所 选用 的 数据 库 管 理 系统 时 ， 事 实 发 现 
就 是 一 种 技术 。 即 使 在 最 后 的 操作 维护 阶段 ， 事 实 发 现 技术 也 用 来 决定 一 个 系统 是 否 需要 提 
高 性 能 或 者 进一步 开发 以 满足 新 的 需求 。 

提示 。 大概 舍 计 一 下 要 在 数据 库 工程 的 事实 发 现 上 花费 多 少时 间 和 精力 是 非常 重要 的 。 

据 分 析 ， 大 量 的 快速 学 习 将 导致 瘫 疾 ， 而 考虑 得 太 少 则 会 由 于 用 错误 的 方法 解决 错误 

的 问题 而 导致 不 必要 的 时 间 和 金钱 的 浪费 。 
6.2 收集 哪些 事实 

在 整个 数据 库 系统 周期 中 ， 开 发 人 员 需 要 捕获 的 事实 包括 系统 当前 的 或 者 将 来 的 事实 。 
表 6-1 用 例子 说 明了 要 捕获 的 数据 种 类 和 在 开发 周期 各 个 阶段 所 产生 的 文档 。 在 第 4 章 中 我 们 
提 到 ， 数 据 库 系统 开发 的 各 个 阶段 并 不 是 严格 按 顺 序 进行 的 ， 而 是 通过 反馈 循环 包括 许多 前 
阶段 的 重复 。 这 也 适用 于 各 个 阶段 的 数据 采集 和 文档 产生 。 例如， 如 果 在 数据 库 设计 阶段 遇 
到 了 问题 ， 就 有 必要 对 新 系统 的 需求 进行 进一步 的 数据 采集 。 

表 6-1 数据 库 应 用 开发 周期 各 个 阶段 采集 的 数据 和 产生 的 文档 示例 


开发 阶段 捕获 的 数据 示例 产后 的 文档 示例 

数据 库 规划 数据 库 工 程 的 目标 和 目的 任务 描述 和 数据 库 系统 目的 

系统 定义 主要 用 户 视图 描述 (包括 工作 角色 /或 者 数据 库 系统 的 边界 和 范围 定义 ， 所 支持 
业务 应 用 领域 ) 的 用 户 视图 的 定义 

需求 收集 和 分 析 用 户 视图 的 要 求 ， 系 统 说 明 ， 包 括 性 能 用 户 和 系统 的 需求 说 明 书 
和 安全 性 要 求 

数据 库 设计 用 户 检查 逻辑 数据 库 设计 后 以 及 目标 逻辑 数据 库 设计 (包括 ER 模型 、 数 据 字 典 、 
DBMS 提 供 的 功能 的 反馈 。 表 )， 物 理 数据 库 设 计 

应 用 程序 设计 用 户 对 界面 设计 的 反馈 应 用 程序 设计 (包括 对 程序 和 界面 的 描述 ) 

DBMS 选 择 目标 DBMS 所 提供 的 功能 DBMS 评 估 和 推荐 

构建 原型 用 户 对 原型 的 反映 修改 了 的 用 户 需求 和 系统 说 明 书 

实现 目标 DBMS 提 供 的 功能 

数据 转换 和 加 载 当前 数据 的 格式 ， 目 标 DBMS 的 数据 导 
入 能 力 

测试 测试 结果 所 使 用 的 测试 方法 、 测 试 结果 的 分 析 

操作 维护 性 能 测试 结果 ， 新 的 或 改变 用 户 和 系统 用 户 手 册 、 性 能 结果 分 析 、 修 改 的 用 户 
需求 需求 与 系统 说 明 书 


在 6.4 节 中 ， 我 们 将 回 过 头 来 检查 数据 库 系统 开发 周期 的 前 3 个 阶段 ， 即 数据 库 规 划 、 系 统 定 
义 、 需 求 收集 和 分 析 。 对 每 一 个 阶段 ， 我 们 以 StayHome 录 像 出 租 公司 为 例 说 明了 利用 事实 发 现 技 
术 收 集 数据 并 产生 文档 的 处 理 过 程 。 但 在 本 节 之 前 ， 我 们 首先 回顾 一 下 最 常用 的 事实 发 现 技术 。 


6.3 事实 发 现 技术 


数据 库 开发 人 员 在 一 个 数据 库 工程 中 通常 使 用 几 种 事实 发 现 技术 。 常 用 的 技术 有 五 种 : 
“检查 文档 

* 面谈 

* 观察 操作 中 的 业务 

“研究 


* 问卷 报告 
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6.3.1 检查 文档 


当 你 想 深 入 了 解 为 什么 客户 需要 数据 库 应 用 时 ， 检 查 文档 是 非常 有 用 的 。 检 查 文 档 也 可 
以 发 现 文档 有 助 于 提供 与 问题 相关 的 业务 信息 (或 者 业务 事务 的 信息 )。 如 果 问 题 与 现存 系统 
相关 ， 则 一 定 有 与 该 系统 相关 的 文档 。 检 查 与 目前 系统 相关 的 文档 、 表 格 、 报 告 和 文件 是 一 
种 非常 好 的 快速 理解 系统 的 方法 。 表 6-2 列 出 了 应 该 检查 的 文档 类 型 的 例子 。 


表 6-2 要 检查 的 文档 类 型 示例 
文档 的 用 途 有 用 资源 示例 
描述 数据 库 的 问题 和 需求 内 部 备忘录 、 电 子 邮件 、 会 议 备 忘 录 
员工 客户 意见 、 问 题 描 述 文档 
效率 回顾 /报告 
描述 受 问 题 影响 的 业务 (或 部 分 业务 ) 组 织 图 表 、 任 务 陈述 、 事 务 战略 计划 
正 被 研究 的 部 分 业务 的 目标 、 任 务 /工作 描述 
手工 的 表格 和 报告 的 例子 
计算 表格 和 报告 举例 
完成 的 表格 /报表 
描述 当前 系统 不 同类 型 的 数据 流 图 和 图 表 
数据 字典 
数据 库 应 用 程序 设计 
程序 文档 
用 户 /培训 手册 
一 -一 -vv 


6.3.2 面谈 


面谈 是 最 常用 的 ， 通 常 也 是 最 有 用 的 事实 发 现 技术 。 通 过 面对面 谈话 可 以 获取 信息 。 面 
谈 还 有 其 他 目的 ， 如 找 出 事实 、 确 认 事 实 、 澄 清 事实 、 得 到 所 有 最 终 用 户 、 标 识 需求 、 集 中 
意见 和 观点 。 然 而 ， 使 用 面谈 这 种 技术 需要 良好 的 交流 能 力 ， 能 够 有 效 地 和 具有 不 同 价值 观 、 
不 同 喜好 、 观 点 、 动 机 和 个 性 的 人 打交道 。 和 其 他 技术 一 样 ， 面 谈 并 不 是 在 所 有 情况 下 都 是 
最 好 的 。 它 的 优 缺 点 见 表 6-3。 


表 6-3 面谈 作为 事实 发 现 技术 的 优 缺 点 


优 点 缺 ”点 
谈话 对 象 可 以 按照 谈话 人 预先 确定 的 感 兴趣 的 内 容 进行 交谈 非常 浪费 时 间 ， 代 价 昂贵 ， 因 此 不 切实 际 
谈话 人 可 以 在 谈话 过 程 中 改编 或 重 述 问题 是 否 成 功 依赖 于 谈话 人 的 交流 技巧 


谈话 人 可 以 观察 谈话 对 象 的 肢体 语言 

谈话 对 象 可 以 自由 地 、 开 放 地 回答 问题 

谈话 对 象 可 以 了 解 部 分 项 目 

有 两 种 类 型 的 面谈 : 有 组 织 的 和 没有 组 织 的 。 没 有 组 织 的 面谈 通常 仅 由 -个 通用 目标 指 
导 ， 并 且 有 非常 少 的 特定 的 问题 。 谈 话 人 依靠 谈话 对 象 提供 谈话 的 框架 和 方向 ， 这 种 类 型 的 
谈话 通常 不 能 抓 住 问题 的 焦点 ， 因 此 ， 你 将 发 现 它 不 是 很 适用 于 数据 库 分 析 和 设计 ， 

在 有 组 织 的 谈话 中 ， 谈 话 人 有 特定 的 问题 要 问 谈话 对 象 。 根 据 谈话 对 象 的 回答 ， 谈 话 者 
将 提出 一 些 附加 的 问题 以 获得 非常 明确 的 答案 并 进行 一 些 扩展 。 没 有 明确 框架 限制 的 问题 能 
够 让 谈话 对 象 用 一 种 看 起 来 适合 的 方式 回答 。 例 如 “为 什么 你 对 成 员 注 册 报表 不 满意 "。 限 制 
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框架 问题 的 答案 要 么 是 特定 选择 ， 要 么 是 短 的 直接 的 回答 。 例 如 “你 是 否 按 时 收 到 了 成 员 注 
册 报 告 ”或 者 “成 员 注 册 报 告 所 包含 的 信息 是 否 精 确 ”"。 这 两 个 问题 只 需 回答 “是 ”或 “ 否 ”。 
提示 为 了 保证 谈话 成 肋 ， 必 须 选择 合适 的 谈话 人 选 ， 准 备 的 问题 涉及 面 要 广 ， 要 引导 

谈话 有 效 地 进行 。 


6.3.3 观察 业务 的 运转 


观察 是 用 来 理解 一 个 系统 的 最 有 效 的 事实 发 现 技术 之 一 。 使 用 这 项 技术 可 以 参与 或 者 观 
察 做 事 的 人 以 了 解 系统 。 当 用 其 他 方法 收集 的 数据 的 有 效 性 值得 怀疑 或 者 系统 特定 方面 的 复 
杂 性 阻碍 了 最 终 用户 做 出 清晰 的 解释 时 ， 这 种 技术 尤其 有 用 。 

与 其 他 事实 发 现 技术 相 比 ， 成 功 的 观察 要 求 非常 多 的 准备 。 为 了 确保 成 功 ， 要 尽 可 能 多 
地 了 解 你 要 观察 的 人 和 活动 。 例 如 ， 所 观察 的 活动 的 低谷 、 正 常 以 及 高 峰 期 分 别 是 什么 时 
候 ? 所 观察 的 人 是 否 会 因为 有 人 观察 他 们 并 记录 他 们 的 活动 而 心情 烦 乱 ? 表 6-4 列 出 了 观 窦 作 
为 一 种 事实 发 现 技术 的 优 缺 点 。 

表 6-4 观察 作为 事实 发 现 技术 的 优 缺 点 


优 点 缺 ”点 
可 以 检查 数据 和 实施 的 有 效 性 当 有 人 观察 时 人 们 可 能 自觉 或 不 白 觉 的 行为 异 党 
观察 者 可 以 很 准确 地 看 到 正在 做 的 事情 在 那 段 时 间 ， 吕 能 会 遗漏 一 些 观察 任务 ， 这 些 任务 的 准 
度 和 量 都 有 所 不 同 
观察 者 也 可 以 获得 描述 任务 的 物理 环境 的 数据 有 些 任务 并 不 总 是 以 它们 被 观察 时 的 方式 运行 
相对 低廉 可 能 不 切实 际 
观察 者 可 以 做 工作 测量 


6.3.4 研究 


一 个 有 用 的 事实 发 现 技术 是 研究 应 用 和 问题 。 计 算 机 行业 的 杂志 、 参 考 书 和 因特网 是 间 
常 好 的 信息 来 源 。 它 们 可 以 提供 有 关 其 他 人 如 何 解决 该 问题 的 信息 ， 也 可 以 告诉 你 要 解决 此 
问题 的 软件 包 是 否 存在 。 表 6-5 列 出 了 研究 作为 事实 发 现 技术 的 优 缺 点 。 

表 6-5 用 研究 作为 事实 发 现 技 术 的 优点 和 缺点 


优 点 缺 ”点 
如 果 解 决 问题 的 方法 已 经 存在 则 能 够 节省 时 间 可 能 很 浪费 时 间 


研究 者 可 以 指导 其 他 人 如 何 解决 相似 的 问题 或 者 需要 获得 合适 的 信息 资源 
怎样 满足 相似 的 要 求 
使 研究 者 能 够 跟 上 最 新 发 展 由 于 问题 在 其 他 地 方 没 有 写成 文档 ， 因 此 最 终 呆 能 
对 解决 问题 没有 什么 帮助 
6.3.5 问卷 调查 


忆 一 各 事实 发 现 技术 是 通过 问卷 来 调查 。 问 卷 是 一 种 有 着 特定 目的 的 小 册子 ， 这 样 可 以 
在 控制 答案 的 同时 ， 集 中 一 大 群 人 的 意见 。 当 和 大 批 听众 打交道 时 ， 其 他 的 事实 发 现 技术 孝 
下 能 有 效 地 把 这 些 事 实 列 成 表格 。 向 着 调查 作为 事实 发 现 技术 的 优 缺 点 见 表 6.6， 

丫 疮 有 两 种 格式 ， 自 由 形式 和 固定 形式 。 在 自由 格式 问卷 上 ， 答 卷 人 提供 的 答案 右 克 大 
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的 自由 。 问 题 提 出 后 ， 答 卷 人 在 题目 后 的 空白 地 方 写 答案 。 自 由 格式 的 问题 举例 如 下 : “你 当 
前 收 到 的 是 什么 报表 ， 它 们 有 什么 用 ”"，“ 这 些 报告 是 否 存在 问题 ， 如 果 有 ， 请 说 明 ”。 自 由 格 
式 问卷 存在 的 问题 是 答卷 人 的 答案 可 能 难以 列 成 表格 ,而且 ， 有 时 答卷 人 可 能 答 非 所 问 。 

表 6-6 问卷 调查 的 优 缺 点 


一 





优 - 内 缺 ”点 
被 调查 者 可 以 很 方便 地 回答 问卷 并 交还 交还 率 可 能 很 低 ， 可 能 只 有 5%~10% 
相对 廉价 的 从 大 批 人 群 中 收集 数据 的 方式 问卷 交还 时 可 能 没有 回答 完整 
当 调查 对 象 的 回答 可 信 度 高 时 ， 他 们 提供 了 真实 情况 没有 机 会 修改 和 重新 描述 被 误解 的 问题 
回答 可 以 列 成 表格 并 迅速 分 析 不 能 观察 和 分 析 答 卷 人 的 肢体 语言 


可 以 使 用 各 种 方式 发 放 问 卷 ， 包 括 人 工 发 放 、 邮 和 寄 、 发 E-mail 准备 问卷 非常 浪费 时 间 


固定 格式 问卷 包含 的 问题 的 答案 是 特定 的 。 给 定 一 个 问题 ， 回 答 者 必须 从 提供 的 答案 中 选择 
一 个 。 因 此 ， 结 果 一 目 了 然 且 容易 列表 。 但 另 一 方面 ， 答 卷 人 不 能 提供 一 些 有 用 的 附加 信息 。 
定格 式 问题 的 例子 如 : 现在 的 录像 出 租 报告 的 形式 非常 理想 ， 不 必 改 动 。 答 卷 人 可 以 选择 的 答案 
有 “是 ”或 “ 否 ”， 或 者 一 组 选项 包括 “非常 赞同 "、“ 同 意 "、“ 没 意见 ”"、“ 不 同意 “强烈 反对 ”。 


6.4 StayHome 案 例 研究 


在 这 一 市 ， 我 们 首先 描述 StayHome 案 例 研 究 ， 然 后 使 用 该 案例 研究 说 明 如 何 通 过 数据 库 
规划 、 系 统 定 义 以 及 需求 收集 和 分 析 这 些 阶段 来 在 数据 库 应 用 开发 周期 的 早期 阶段 建立 一 个 
数据 库 工程 。 


6.4.1 StayHome 案 例 研究 一 一 概览 


这 个 案例 研究 描述 了 一 个 叫 StayHome 的 公司 ， 该 公司 出 租 录 像 给 其 成 员 。StayHome 的 首 
家 分 公司 成 立 于 1982 年 ， 地 点 在 西雅图 。 但 该 公司 现在 日 益 壮 大 ， 有 许多 连锁 点 遍布 全 美 。 
该 公司 的 成 功 秘诀 是 它 给 顾客 提供 了 一 流 的 服务 ， 并 且 收 藏 的 录像 门类 齐全 。 

StayHome 现 在 有 2000 名 员工 分 布 在 100 个 部 门 中 。 当 有 新 员工 加 盟 公 司 时 ， 需 要 使 用 员 
工 注 册 表 格 。 来 自 Mary Martinez 的 员工 注册 表格 如 图 6-1 所 示 。 





图 6-1 来 自 Mary Martinez 的 StayHome 的 员工 注册 表 
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每 个 分 公司 都 有 一 名 经 理 和 数 名 主管 。 经 理 负 责 日 常事 务 ， 而 主管 则 监督 旗下 员工 。 西 
雅 图 分 公司 员工 列表 的 第 一 页 见 图 6-2。 


Branch Number B002 Branch Address 


City Center Plaza, Seattie, 
Telephone Number(s) er 
206-555-6756/206-555-8836 WA 98122 
a en de a 








图 6-2 在 西雅图 分 公司 工作 的 员工 列表 的 第 一 页 


StayHome 的 每 个 分 公司 都 有 库存 的 录像 以 备 出 租 。 每 盘 录 像 用 分 类 号 码 唯一 标识 。 但 是 
大 多 数 情况 下 ， 在 一 个 分 公司 中 ， 同 一 盘 录 像 有 多 份 拷贝 ， 因此 每 份 拷贝 用 录像 号 码 来 区 分 。 
西雅图 分 公司 可 以 出 租 的 录像 清单 的 第 一 页 如 图 6-3 所 示 。 





图 6-3 西雅图 分 公司 可 以 出 租 的 录像 清单 的 第 一 页 
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顾客 在 租 录 像 之 前 ， 必 须 先 成 为 公司 的 一 名 会 员 。 顾 客 加 入 时 要 填写 StayHome 会 员 注册 
表格 。 顾 客 Don Nelson 的 会 员 注 册 表 格 如 图 6-4 所 示 。StayHome 当 前 大 约 有 10 万 会 员 。 一 个 顾 
客 可 以 在 不 同 分 公司 分 别 注册 ， 但 每 次 注册 都 要 填写 一 张 注 册 表 格 。 西 雅 图 分 公司 的 会 员 清 
单列 表 的 第 一 页 如 图 6-5 所 示 。 











Member Number M284354 Branch Number 





(Enter if known) 
Full Name Branch Address 
Don Nelson City Center Plaza, 









Member Address Seattle, WA 98122 


123 Sutfolk Lane, 





Registered By 
Robert Chin . 





Seattle, WA 98117 
Date Registered _09-0t01_ 









图 6-4 顾客 Don Nelson 的 会 员 注 册 表 格 








图 6-5 西雅图 分 公司 的 会 员 清 单列 表 的 第 一 页 
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会 员 注 册 后 ， 可 以 自由 租借 录像 ， 一 次 最 多 借 10 盘 录像 。 当 会 员 租 借 录 像 时 ， 要 
StayHome 录 像 租借 表格 。 图 6-6 是 Claire Sinclair 租借 录像 《Harry Potter》 和 《Shrek》 的 已 完 


成 的 租借 表格 。 








图 6-6 Claire Sinclair 租借 StayHome 录 像 的 例子 


随 着 公司 的 壮大 ， 公司 使 用 和 产生 的 数据 量 日 益 增 大 ， 管理 变 得 非常 困难 。 为 确保 公司 继 
续 发 展 ，StayHome 的 主管 强烈 要 求 建立 数据 库 应 用 程序 来 帮助 解决 日 益 庞 大 的 数据 管理 问题 。 


6.4.2 StayHome 案 例 研究 一 数据 库 规划 


开发 数据 库 应 用 的 第 一 个 步骤 是 清楚 地 定义 数据 库 工 程 的 任务 陈述 ， 这 个 任务 陈述 定义 
了 数据 库 应 用 程序 的 主要 目标 。 这 些 推动 了 业务 (如 主管 或 拥有 者 ) 中 的 数据 库 工程 正常 地 
定义 任务 陈述 。 任务 陈述 可 以 帮助 澄清 数据 库 工 程 的 目标 ， 为 开发 出 一 个 简洁 高 效 的 数据 库 
应 用 程序 提供 更 清楚 的 途径 。 

定义 好 任务 陈述 之 后 ， 下 一 个 活动 包括 确定 任务 目标 。 每 个 任务 目标 应 该 标识 一 个 数据 
库 必 须 支持 的 特定 任务 。 前 提 是 数据 库 支持 的 任务 目标 在 任务 陈述 中 必须 有 定义 。 任务 陈述 
和 目标 可 能 伴随 着 许多 额外 信息 ， 这 些 信息 通常 指定 了 要 完成 的 工作 ， 完成 工作 所 要 使 用 的 
资源 以 及 所 要 支付 的 金钱 等 。 

1. 创建 StayHome 数 据 库 系 统 的 往 务 陈述 

为 了 产生 StayHome 数 据 库 系统 的 任务 陈述 ， 应 该 首先 和 公司 主管 谈话 ， 并 和 主管 指定 的 
人 员 会 谈 。 在 这 个 阶段 ， 提出 一 些 谈话 对 象 可 以 自由 回答 的 问题 通常 是 最 有 用 的 。 例如 ， 你 
(数据 库 开发 人 员 ) 可 以 通过 询问 StayHome 主 管 下 述 问题 来 开始 谈话 : 

开发 人 员 : 公司 的 目标 是 什么 ? 

主管 : 通过 遍布 全 美国 的 分 公司 ， 我 们 提供 各 种 各 样 的 录像 出 租 给 已 注册 的 会 员 。 
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开发 人 员 : 你 为 什么 需要 使 用 数据 库 ? 

主管 : 老实 说 ， 我 们 不 能 应 付 我 们 所 取得 的 成 功 。 过 去 几 年 ， 我 们 新 开 了 几 个 分 公司 ， 
每 个 分 公司 提供 的 录像 选择 范围 都 很 广 ， 注 册 会 员 也 越 来 越 多 。 但 是 这 些 成 功 也 带 来 了 日 总 
产 重 的 数据 管理 问题 ， 这 导致 我 们 提供 的 服务 水 平 有 所 下 降 。 而 且 ， 公 司 各 分 公司 间 的 合作 
和 信息 共享 的 程度 也 很 低 ， 这 是 一 个 令 人 头疼 的 问题 ， 

开发 人 员 : 你 怎么 知道 使 用 数据 库 可 以 解决 你 们 的 问题 ? 

主管 : 我 所 知道 的 全 部 就 是 我 们 被 堆积 如 山 的 文书 所 淹没 。 我 们 需要 -一些 东 西 来 加 速 我 
们 的 工作 ， 也 或 是 说 ， 它 能 够 自动 处 理 日 常事 务 ， 这 些 事情 似乎 现在 每 天 都 要 做 。 我 也 硕 记 
备 分 公司 可 以 同时 开始 工作 。 数 据 库 可 以 做 到 这 些 的 ， 是 吗 ? 

这 类 型 问题 的 回答 有 助 于 明确 地 写 出 问题 陈述 。 例 如 ，StayHome 公 司 的 数据 库 解决 方案 
的 问题 陈述 如 图 6-7 所 示 。 当 你 感到 已 经 有 了 一 个 清晰 的 、 不 含糊 的 任务 陈述 ,而 且 StayHome 
公司 的 员工 都 认同 时 ， 就 可 以 开始 定义 任务 目标 了 。 








StayHome 的 数据 库 系 统 的 目的 是 收集 、 存 储 和 控制 公 本 产生 的 数据 ， 支 持 而 向 会 员 的 录 
像 出 租 业 务 、 方 便 分 公 可 之 间 的 合作 和 信息 共享 。 






图 6-7 StayHome 公 司 的 数据 库 应 用 的 任务 陈述 


2. 创建 StayHome 数 据 库 系 统 的 任务 目标 

创建 任务 目标 的 过 程 包括 与 员工 中 的 合适 人 选 进行 的 引导 性 谈话 。 自 由 提问 通常 在 这 个 
阶段 是 最 有 用 的 。 为 了 获得 完整 的 任务 目标 ， 应 该 与 StayHome 中 不 同 角色 的 人 员 交 谈 。 可 以 
问 的 典型 的 问题 如 下 : : 

"请 描述 你 的 工作 。 

“通常 在 一 天 里 你 要 做 什么 工作 ? 

“你 会 和 什么 数据 打交道 ? 

* 你 需要 使 用 哪些 类 型 的 报告 ? 

。 你 要 明白 哪些 事情 ? 

“ 公司 给 你 的 会 员 提供 哪些 服务 ? 

这 尝 辣 题 可 以 问 公司 的 主管 或 者 经理 、 监 理 、 助 理 和 采购 员 。 当 然 ， 随 着 采访 用 户 的 不 
同 ， 有 必要 调整 问题 。 

(1) 主管 

开发 人 员 : 请 问 你 在 公司 做 哪些 工作 ? 

二 管 ; 我 监督 公司 的 运行 ， 保 证 我 们 能 不 断 地 为 会 员 提供 最 好 的 录像 出 程 服务 

开发 人 员 : 你 每 天 要 处 理 什么 事情 ? 

和 ”我 视察 我 的 经 理 们 所 管理 的 每 个 分 公司 的 运行 情况 。 我 必须 努力 保证 各 个 分 公 
故居 工作 ， 夫 可 录像 和 会 员 信息 。 我 也 检查 公司 采购 员 的 工作 。 他 负责 给 公司 所 有 分 作 
”由 关东 像 。 一 般 玉 说 ， 每 一 到 两 个 月 我 会 调查 各 个 分 公司 的 情况 ， 以 便 非 常 清 想 地 了 解 
各 个 经 理 的 能 力 。 

开发 人 员 : 你 处 理 哪 些 数据 ? ， 
二 全: 我 需要 能 够 亲自 处 理 公司 使 用 和 产生 的 每 一 件 训 情 ， 包 括 员工 名 册 、 录 像 ， 山 加 


站 








业务 、 会 员 、 录 像 提供 商 、 录 像 订单 。 我 的 意思 是 每 件 事情 我 都 要 了 解 。 

开发 人 员 : 你 需要 使 用 哪 种 类 型 的 报表 ? 

主管 :我 要 知道 各 个 分 公司 发 生 了 什么 情况 ? 我 从 各 种 有 关 员 工 、 库 存 录像 、 录 像 出 租 、 
会 员 和 录像 提供 商 和 订单 的 报告 中 来 获取 信息 。 

开发 人 员 : 哪些 类 型 的 事务 你 需要 很 明白 ? 

主管 : 就 像 我 前 面 所 说 ， 我 要 知道 每 一 件 事 情 的 来 龙 去 脉 。 

开发 人 员 : 公司 为 会 员 提供 哪些 服务 ? 

主管 : 我 要 在 全 美 提供 服务 最 好 、 价 格 最 便宜 的 录像 出 租 服务 。 


(2) 经 理 


- 开发 人 员 : 你 能 描述 一 下 你 的 工作 吗 ? 

经 理 : 我 的 职位 是 经 理 。 我 监督 我 的 分 公司 的 日 常 运营 情况 ， 以 给 会 员 提 供 最 好 的 服务 。 

开发 人 员 : 典型 地 ， 每 天 你 要 处 理 什 么 工作 ? 

经 理 : 我 要 保证 每 天 24 小 时 部 门 内 都 有 一 定数 量 的 合适 的 人 员 在 值班 ， 同 时 要 保证 有 合 
适 的 录像 数量 供 顾 客 选 择 ， 虽 然 我 不 实际 参加 录像 采购 一 一 这 由 公司 采购 人 员 负 责 。 我 监控 
新 会 员 的 注册 和 员工 的 聘用 。 

开发 人 员 : 你 处 理 哪些 数据 ? 

经 理 : 我 需要 处 理 员 工 、 录 像 、 出 租 和 会 员 数 据 。 

开发 人 员 : 你 使 用 哪些 报表 ? 

经 理 : 有 关 员 工 、 库 存 录 像 、 录 像 出 租 和 会 员 的 各 种 报表 。 

开发 人 员 : 你 需要 清楚 了 解 哪些 事情 ? 

经 理 : 员工 、 库 存 录 像 、 录 像 出 租 和 会 员 。 

开发 人 员 : 你 的 公司 提供 给 会 员 哪 些 服务 ? 

经 理 : 我 们 在 本 地 区 提供 给 会 员 最 好 的 录像 出 租 。 


(3) 监理 


开发 人 员 : 请 介绍 一 下 你 的 工作 。 

监理 : 我 的 头衔 是 监理 。 我 监督 一 个 小 组 的 员工 ， 并 且 在 提供 录像 出 租 服务 时 直接 与 我 
们 的 会 员 打 交道 。 

开发 人 员 : 你 每 天 做 哪些 事情 ? 

监理 : 我 给 员工 分 配 具 体 的 任务 ， 例 如 和 会 员 打 交道 、 整 理 录像 柜 和 文件 。 我 回答 会 员 
对 可 以 出 租 的 录像 的 咨询 ， 处 理 录像 租借 和 归还 。 我 随时 更 新 我 们 的 会 员 信 息 ， 当 有 顾客 想 
作为 一 名 会 员 加 入 时 ， 我 帮 他 们 注册 。 

开发 人 员 : 你 处 理 哪 些 数据 ? | 

监理 : 和 员工 信息 、 录 像 、 租 借 事务 以 及 会 员 信息 相关 的 数据 。 

开发 人 员 : 你 要 使 用 哪些 报告 ? 

监理 : 员工 情况 报告 和 库存 录像 报告 。 

开发 人 员 : 你 需要 明确 哪些 事情 ? 

监理 : 我 要 知道 某 些 录像 是 否 可 以 出 租 ， 会 员 的 详细 情况 是 否 是 最 新 的 。 
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(4) 助理 


开发 人 员 : 请 描述 一 下 你 的 工作 。 

助理 : 我 是 助理 。 在 提供 录像 出 租 服 务 中 ， 我 直接 与 会 员 打 交道 。 

开发 人 员 : 你 每 天 的 日 常 工作 是 什么 ? 

助理 : 我 负责 回答 对 可 出 租 录 像 的 咨询 。 你 知道 我 的 意思 ， 他 们 会 问 :“ 你 们 有 这 种 录像 
吗 ?9 ”， 我 处 理 录像 的 出 租 和 收回 ， 并 把 它们 重新 放 到 录像 柜 里 。 工 作 不 忙 的 时 候 ， 我 整理 文件 。 

开发 人 员 : 你 处 理 哪些 类 型 的 数据 ? 

助理 : 我 处 理 有 关 和 录像 、 租 借 业 务 和 会 员 的 数据 。 

开发 人 员 : 你 使 用 哪些 报告 ? 

助理 : 没有 。 

开发 人 员 : 你 需要 明确 哪些 事情 ? 

助理 : 我 要 知道 我 们 是 否 有 某 种 录像 可 以 出 租 。 

开发 人 员 : 你 们 公司 给 会 员 提 供 哪些 服务 ? 

助理 : 我 们 要 回答 有 关 库 存 录 像 的 问题 ， 比 如 “你 们 有 明星 Ewan MacGregor 主 演 的 片子 
吗 ? ”,“《2001 A Space Odyssey》 是 谁 主演 的 ， 谁 导演 的 ? ”， 你 不 能 相信 我 们 的 会 员 期 望 
我 们 要 知道 什么 ， 但 是 幸运 的 是 大 多 数 人 在 这 里 工作 是 因为 我 们 真 的 投入 到 电影 中 ， 所 以 ， 
即使 我 不 知道 ， 我 的 同伴 也 会 知道 。 

(5) 采购 员 


开发 人 员 : 请 描述 一 下 你 的 工作 。 

采购 员 : 我 是 采购 员 ， 负 责 为 公司 的 所 有 分 公司 购买 供出 租 的 录像 。 

开发 人 员 : 你 的 日 常 工 作 是 什么 ? 

采购 员 : 我 直接 与 分 公司 经 理 和 录像 提供 商 打交道 。 我 负责 回应 部 门 经 理 的 请 求 ， 向 他 
们 提供 录像 。 我 的 工作 是 在 向 录像 供应 商 购 买 录像 时 获得 尽 可 能 仗 的 价位 。 当 然 ， 我 也 依赖 
经 理 们 处 理 好 他 们 的 事情 一 一 我 不 希望 订购 各 分 公司 不 需要 的 录像 ， 也 不 想 发 现 有 分 公司 没 
有 足够 份 数 的 某 部 流行 的 电影 。 有 空 的 时 候 ， 我 去 监测 各 分 公司 录像 出 租 的 情况 ， 来 检查 他 
们 是 否 有 合适 的 录像 供用 户 选 择 。 

开发 人 员 : 你 处 理 哪 些 类 型 的 数据 ? 

采购 员 : 我 需要 知道 分 公司 信息 、 录 像 信 息 、 录 像 出 租 信息 、 会 员 信息 、 录 像 订购 信息 
和 供应 商 的 情况 。 

开发 人 员 : 你 使 用 哪 种 形式 的 报告 ? 

采购 员 : 我 需要 我 购买 的 录像 的 订单 报告 ， 其 他 各 种 报告 有 : 库存 录像 情况 报告 ， 录 像 
租借 情况 报告 ， 每 个 分 公司 和 整个 公司 的 会 员 情 况 报告 。 

开发 人 员 : 你 要 明确 了 解 什么 事情 ? 

采购 员 : 我 需要 最 新 的 录像 订单 信息 ， 只 与 不 会 让 我 们 失望 的 供应 商 合作 ， 这 是 非常 重 
要 的 。 还 有 ， 我 要 知道 每 个 分 公司 的 库存 录像 和 录像 出 租 情 况 。 正 如 我 前 面 所 讲 ， 我 不 想 购 
买 各 分 公司 都 不 需要 的 录像 。 

开发 人 员 : 你 们 公司 给 会 员 提供 什么 服务 ? ， 

采购 员 : 我 们 要 努力 给 会 员 提供 最 好 的 录像 选择 ， 并 且 租 借 葛 用 尽 可 能 低 。 





84 圳 二 部 分 绕 据 亩 分 析 与 肆 矿 技术 


这 种 类 型 问题 的 答案 ， 有 助 于 开发 人 员 形 成 明确 的 任务 目标 。 例 如 ，StayHome 数 据 库 的 
任务 目标 如 图 6-8 所 示 。 


维护 〈 录 入、 更 新 和 删除 ) 各 个 分 公司 的 数据 
维护 (录入 、 更 新 和 删除 ) 有 关 员 工 的 数据 
维护 (录入 、 更 新 和 删除 ) 录像 数据 

维护 (录入 、 更 新 和 删除 ) 会 员 数 据 

维护 (录入 、 更 新 和 删除 ) 录像 出 租 业 务 数据 
维护 (录入 、 更 新 和 删除 ) 录像 供应 数据 
维护 (录入 、 更 新 和 删除 ) 提供 录像 的 订单 数据 
实现 对 分 公司 的 查询 

实现 对 录像 的 查询 

实现 对 员工 的 查询 

实现 对 录像 租借 的 查询 

实现 对 会 员 的 查询 

实现 对 录像 供应 商 的 查询 

实现 对 录像 订单 的 查询 

跟踪 库存 录像 库存 状态 信息 

跟踪 录像 租借 状态 信息 

跟踪 录像 订单 状态 信息 

报告 各 分 公司 情况 

报告 各 个 分 公司 员工 情况 

报告 各 个 分 公司 录像 情况 

报告 各 个 分 公司 会 员 情况 

报告 各 个 录像 租借 情况 

报告 供应 商 的 情况 

报告 录像 订单 的 情况 


图 6-8 StayHome 数据 库 的 任务 目标 





6.4.3 StayHome 案 例 研究 一 一 系统 定义 


系统 定义 的 目的 是 确定 数据 库 应 用 的 范围 和 边界 以 及 它 的 主要 用 户 的 视图 。 一 个 用 户 视 
图 代表 数据 库 应 用 必须 支持 的 由 一 个 特殊 的 工作 角色 (如 经 理 或 助理 ) 或 者 业务 范围 (如 录 
像 出 租 或 库存 控制 ) 所 定义 的 需求 。 

1. 定义 StayHome 数 据 库 系 统 的 系统 边界 

在 数据 库 系统 开发 生命 周期 的 这 个 阶段 ， 开发 人 员 应 该 和 用 户 交流 以 浴 清 和 扩展 前 些 阶 
段 所 获得 的 数据 。 但 也 可 以 应 用 其 他 事实 发 现 技术 ， 包括 检查 6.4.1 节 中 显示 的 案例 文档 。 现 
在 应 该 分 析 所 收集 到 的 数据 来 定义 应 用 程序 边界 。 StayHome 数 据 库 应 用 的 系统 边界 如 图 6-9 所 
示 。 图 中 包含 的 是 前 面 会 谈 所 提 到 的 数据 以 及 这 些 数据 之 间 的 相互 关系 的 粗略 向 导 。 
2. 标识 StayHome 数 据 库 系统 的 主要 用 户 视图 

现在 应 该 对 收集 到 的 数据 进行 分 析 了 ， 以 便 定义 数据 库 应 用 的 主要 用 户 视图 。 有 关 各 个 
用 户 视 图 的 大 部 分 数据 是 在 和 主管 、 经 理 、 监 理 、 助理 和 采购 员 面谈 的 时 候 收 集 到 的 。 
StayHome 数 据 库 应 用 的 主要 用 户 视图 如 图 6- 10 所 示 。 
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培训 课程 






报告 所 有 的 分 公司 
报告 在 所 有 分 公司 的 员工 

报告 在 所 有 分 公司 的 录像 

报告 在 所 有 分 公司 的 会 员 

报告 在 所 有 分 公司 的 录像 租借 情况 
报告 所 提供 的 录像 

报告 录像 订单 

维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 数据 
维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 员工 的 数据 
实现 对 分 公司 的 检索 

实现 对 所 有 分 公司 的 员工 的 检索 

报告 给 定 分 公司 的 员工 

报告 所 有 分 公司 的 录像 

报告 所 有 分 公司 的 会 员 

报告 所 有 分 公司 的 录像 租借 情况 

维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 录像 的 数据 
维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 会 员 的 数据 
维护 ( 录 和 人 、 更 新 和 删除 ) 给 定 分 公司 的 录像 租借 的 数据 
实现 对 所 有 分 公司 的 录像 的 检索 

实现 对 给 定 分 公司 的 录像 租借 的 检索 

实现 对 给 定 分 公司 的 会 员 的 检索 

跟踪 给 定 分 公司 的 库存 中 的 录像 的 状态 

跟踪 给 定 分 公司 的 库存 中 的 录像 的 租借 状态 昌 
报告 给 定 分 公司 的 员工 

维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 录像 租借 数据 
维护 (录入 、 更 新 和 删除 ) 给 定 分 公司 的 会 员 的 数据 
实现 对 所 有 分 公司 的 录像 的 检索 

实现 对 给 定 分 公司 的 录像 租借 的 检索 

实现 对 给 定 分 公司 的 会 员 的 检索 


跟踪 给 定 分 公司 的 库存 中 的 录像 的 状态 ~ 


跟踪 给 定 分 公司 的 库存 中 的 录像 的 租借 状态 


图 6-10 StayHome 数 据 库 应 用 的 主要 用 户 视 图 
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用 户 视图 





Buyer 维护 (录入 、 更 新 和 删除 ) 录像 数据 
维护 (录入 、 更 新 和 删除 ) 录像 供应 商 数 据 
维护 (录入 、 更 新 和 删除 ) 录像 订单 数据 
实现 对 公司 的 检索 
实现 对 所 有 分 公司 的 录像 的 检索 
实现 对 录像 供应 商 的 检索 
实现 对 录像 订单 的 检索 
跟踪 录像 订单 的 状态 
报告 在 所 有 分 公司 的 录像 
报告 在 所 有 分 公司 的 录像 租借 情况 
报告 在 所 有 分 公司 的 会 员 
报告 录像 供应 商 
报告 录像 订单 | 


图 6-10 ( 续 ) 











6.4.4 stayHome 案 例 研究 一 需求 收集 和 分 析 


这 个 阶段 ， 开 发 人 员 应 该 继续 收集 前 面 阶段 所 标识 的 用 户 视图 的 更 多 细节 ， 产 生 用 户 的 
需求 说 明 。 用 户 的 需求 说 明 详细 描述 了 数据 库 中 应 该 包含 的 数据 以 及 数据 的 使 用 方式 。 在 收 
集 更 多 的 用 户 视图 相关 的 数据 的 同时 ， 也 应 该 努力 收集 系统 的 一 般 需 求 ， 收 集 信息 的 目的 是 
产生 系统 的 需求 说 明 。 系 统 需求 说 明 描 述 了 在 新 的 数据 库 应 用 中 所 要 包含 的 各 种 特性 ， 如 网 
络 需 求 、 共 享 访问 需求 、 效 率 需求 以 及 安全 级 别 需求 。 

在 收集 用 户 视图 需求 的 数据 和 整个 系统 需求 的 数据 时 ， 开 发 人 员 将 会 了 解 当前 系统 的 运 
行 方式 。 当 然 ， 我 们 是 正在 建立 一 个 新 系统 ， 在 给 新 系统 引进 新 的 优良 特性 的 同时 还 应 该 尽 
量 保留 老 系 统 的 好 的 方面 。 

与 此 阶段 相关 的 一 个 非常 重要 的 活动 是 怎样 处 理 有 多 个 用 户 视图 的 情况 。 我 们 在 4.6 节 讨 
论 过 ， 有 三 种 主要 的 方法 来 处 理 多 用 户 视图 ， 即 集中 式 方法 ， 视 图 集成 法 ， 以 及 前 面 两 种 方 
法 的 综合 。 这 里 将 简单 地 告诉 大 家 如 何 运 用 这 些 方 法 。 

1. 收集 和 StayHome 数 据 库 系统 的 用 户 视图 相关 的 更 多 信息 

为 了 找到 每 个 用 户 视图 的 更 多 的 需求 信息 ， 你 可 以 再 次 使 用 一 种 事实 发 现 技术 ， 如 面谈 
和 观察 业务 操作 。 例 如 可 以 问 用 户 下 面 这 些 问题 ， 以 了 解 一 个 用 户 视图 所 需要 的 数据 (用 X 表 
示 ) 的 情况 : 

“在 X 中 ， 你 要 包含 哪些 类 型 的 数据 ?“ 

“你 要 对 和 做 那些 操作 ? ” 

例如 ， 你 可 以 问 一 个 分 公司 经 理 如 下 问题 : 

开发 人 员 : 在 员工 情况 中 ， 你 要 包含 哪些 类 型 的 数据 ? 

经 理 : 在 员工 情况 信息 中 需要 包含 姓名 、 职 务 、 薪 水 。 每 个 员工 有 员工 号 ， 在 整个 公司 
是 唯一 的 。 

开发 人 员 : 你 要 对 员工 信息 做 哪些 操作 ? 
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经 理 : 我 要 录入 新 员工 的 详细 情况 ， 删 除 离开 公司 的 员工 记录 。 随 时 更 新 员工 信息 ， 并 
列表 打印 我 们 分 公司 的 员工 的 姓名 、 职 务 、 薪 水 。 我 需要 分 配 监督 人 去 照看 员工 们 的 工作 ， 
有 了 时 候 我 起 与 其 他 分 公司 联系 ， 这 时 候 我 需要 查 到 其 他 分 公司 的 经 理 的 名 字 。 


你 可 以 针对 数据 库 中 要 存储 的 所 有 数据 问 类 似 的 问题 ， 这 些 问题 的 回答 有 助 于 确定 用 户 
需求 定义 中 的 必要 的 细节 。 

2. 收集 StayHome 数 据 库 系 统 的 系统 需求 信息 

在 和 用 户 商讨 用 户 视图 需求 的 同时 ， 还 应 该 收集 关于 系统 需求 的 更 一 般 的 信息 。 你 可 以 
问 如 下 的 问题 : 

数据 库 中 经 常 要 进行 什么 操作 ? 

什么 事务 对 这 种 业务 操作 是 非常 关键 的 ? 

什么 时 候 运行 严格 的 事务 ? 

它们 运行 的 高 峰 期 、 正 常 期 和 低谷 期 各 是 什么 ? 

数据 库 系 统 需要 哪 种 类 型 的 安全 机 制 ? 

是 否 存 在 只 能 由 某 些 成 员 使 用 的 敏感 数据 ? 

要 保存 哪些 历史 数据 ? 

对 数据 库 系统 的 网 络 和 共享 访问 有 哪些 需求 ? 


例如 ， 可 以 问 经 理 如 下 问题 。 


开发 人 员 : 数据 库 中 经 常 要 运行 什么 事务 ? 

公理 ; 我 们 经 常 被 电话 或 者 会 员 要 求 查询 某 部 录像 并 且 看 这 部 录像 是 否 能 够 租借 、 当 处 
录像 租 出 和 收回 是 非常 频 葡 的 事情 。 

开发 人 员 : 哪些 事务 对 这 些 业务 操作 是 关键 的 ? 

生理 ;关键 的 操作 包括 : 搜索 指定 好 像 ， 录 像 租 出 和 收回 。 如 果 我 们 不 能 有 效 地 提供 这 
些 最 基本 的 服务 ,会员 就 会 去 其 他 的 地 方 。 - 

开发 人 员 : 什么 时 候 运行 这 些 关键 的 事务 ? 

经 理 : 每 天 。 

开发 人 员 : 对 于 这 种 关键 的 事务 ， 它 们 运行 的 高 峰 期 、 正 常 期 和 低谷 期 各 是 什么 ? 

全 于” 一 般 玉 说 ,早上 比较 清闲 ， 随 着 一 天 时 间 的 推 其 ， 业 务 变 得 繁忙 。 每 天 顾客 最 多 
四 时 个 在 下 午 6 点 ~9 点 。 在 周 五 和 周 六 的 这 段 时 间 内 我 们 其 至 不 得 不 增加 一 倍 的 值班 员工 


你 可 以 问 主管 如 下 问题 : 


开发 人 员 : 数据 库 应 用 需要 哪 种 类 型 的 安全 机 制 ? 

主管 ;我 起 一 个 保 丰 录像 出 租 公司 的 数据 库 没有 什么 非常 放 感 的 数据 ， 但 是 我 也 不 起 我 们 
会 员 和 他 们 租 备 的 录像 被 我 们 的 竞争 者 知道 。 员工 们 只 需要 知道 完成 他 们 的 工作 所 需要 的 
深 据 ， 并 且 这 些 数据 的 表现 形式 适合 他 们 的 工作 。 例如， 虽然 监理 和 助理 有 必 妆 知道 会 矶 
“个 且 会 员 的 记录 显示 给 他 们 看 的 时 候 ， 愉 需要 一 次 一 条 记录 ， 而 不 能 作为 一 张 报名 显示 ， 

开发 人 员 : 是 否 存 在 只 能 由 某 些 成 员 使 用 的 教 感 数据 ? 

一 莹 ”加 市 面 所 说 ， 员 工 们 只 需要 知道 完成 他 们 的 工作 所 需要 的 数据 ， 全 如， 监督 人 十 
车 看 到 员工 的 详细 情况 ， 但 是 员工 的 薪水 情况 应 该 只 有 我 一 个 人 知道 ， 
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开发 人 员 : 要 保存 哪些 历史 数据 ? 

主管 : 我 希望 在 会 员 最 后 一 次 租借 录像 之 后 ， 能 够 保存 会 员 的 详细 信息 两 年 ， 这 样 ， 我 
们 可 以 通知 他 们 ， 告 诉 他 们 我 们 最 近 的 优惠 信息 来 吸引 他 们 回来 。 我 也 要 保存 录像 租借 信息 
两 年 ， 这 样 ， 可 以 分 析 找 出 哪 种 类 型 的 录像 最 受 欢迎 ， 哪 个 年 龄 段 的 人 最 经 常 租 录像 ， 等 等 。 

开发 人 员 : 对 数据 库 系 统 的 网 络 和 共享 访问 有 哪些 需求 ? 

主管 : 我 需要 所 有 分 公司 和 在 西雅图 的 总 公司 用 网 络 连 接 ， 员工 可 以 随时 随地 访问 这 个 
系统 。 在 大 部 分 分 公司 ， 我 希望 大 约 有 2~3 名 员工 可 以 在 任何 时 候 访问 这 个 系统 ， 但 是 请 记 住 
我 们 有 100 个 分 公司 ， 大 多 数 时 间 ， 员 工 们 只 需 访 问 本 地 数据 。 我 真 的 不 希望 对 于 本 系统 被 访 
问 的 时 间 和 方式 有 任何 限制 ， 除 非 有 什么 商业 机 密 。 

开发 人 员 : 你 们 需要 那 种 类 型 的 操作 失败 和 数据 丢失 的 保护 ? 

主管 : 当然 是 最 好 的 。 我 们 所 有 的 业务 都 可 以 用 数据 库 指 导 完 成 ， 所 以 如 果 系 统 不 能 正 
常 工作 ， 我 们 就 完了 。 严 肃 来 讲 ， 我 认为 可 以 在 每 晚 分 公司 关门 后 备份 数据 ， 你 认为 怎样 ? 


你 可 以 针对 系统 的 各 个 方面 问 一 些 类 似 的 问题 ， 这 些 问 题 的 回答 有 助 于 确定 系统 需求 定 
义 中 的 必要 的 细节 。 

3. 管理 StayHome 数 据 库 系统 的 用 户 视图 

你 怎样 决定 是 用 集中 式 还 是 视图 集成 方法 来 管理 多 个 用 户 视图 ? 一 种 帮 有 你 做 决定 的 方法 
是 检查 在 系统 定义 阶段 定义 的 各 个 用 户 视图 之 间 的 数据 重合 。 表 6-7 交 叉 引 用 了 主管 、 经 理 、 
监理 、 助 理 和 采购 员 的 用 户 视图 所 使 用 的 主要 类 型 数据 ( 即 供应 商 、 录 像 订单 、 录 像 、 分 公 
司 、 员 工 、 租 借 和 会 员 )。 . 

表 6-7 有 StayHome 数 据 库 系 统 使 用 的 主要 数据 类 型 的 用 户 视图 的 交叉 引用 


Supplier VideoOrder Video Branch Staff Rental Member 
Director x x x x x x x 
Manager x x x x x 
Supervisor x x x x x 
Assistant x x x x 
Buyer x x x x x x 


从 这 张 表 可 以 看 出 在 所 有 的 用 户 视图 之 间 有 数据 重 和 到。 然而， 主管 和 采购 员 视 图 对 附加 
数据 的 需求 《 即 供 应 商 和 录像 订单 ) 和 其 他 视图 是 不 同 的 。 基 于 这 个 分 析 ， 我 们 应 该 使 用 集 
中 式 方法 首先 把 主管 视图 和 采购 员 视 图 的 需求 合并 起 来 (给 定 集合 名 字 为 业务 视图 ), 把 经 理 、 
采购 员 和 助理 的 视图 的 需求 合并 起 来 (命名 为 分 公司 用 户 视图 )。 然 后 开发 代表 业务 视图 和 分 
公司 用 户 视图 的 数据 模型 ， 再 使 用 视图 集成 的 方法 合并 这 两 个 数据 模型 。 当 然 ， 像 StayHome 
这 样 一 个 简单 的 示例 ， 可 以 对 所 有 的 用 户 视图 轻松 使 用 集中 式 方法 ， 但 是 为 了 在 实践 中 演示 
集中 式 和 视图 集成 两 种 方法 ， 我 们 仍 决定 创建 两 个 视图 来 标识 StayHome 的 两 个 集合 用 户 ， 

对 于 什么 时 候 使 用 集中 式 方法 ， 什 么 时 候 使 用 视图 集成 方法 ， 很 难 给 出 一 个 准确 的 区 分 规 
则 。 作 为 数据 库 开发 人 员 ， 你 应 该 根据 对 数据 库 系统 的 复杂 性 的 估计 和 不 同 视图 的 数据 重 疮 各 
度 来 作 决定 。 无 论 使 用 集中 式 方法 ， 还 是 视图 集成 方法 ， 甚 至 两 种 方法 的 结合 来 建立 支撑 数据 
库 ， 最 终 都 需要 为 工作 数据 库 系 统 创建 原始 的 用 户 视图 。 我 们 将 在 第 14 章 讨论 数据 库 用 户 视 图 
的 建立 。 在 本 章 的 余下 部 分 ， 我 们 提供 了 StayHome 的 每 个 分 公司 用 户 视图 的 用 户 需 求 定义 ， 
以 及 数据 库 系统 的 系统 说 明 。 
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4. 创建 StayHome 数 据 库 系统 的 各 分 公司 用 户 视 图 的 用 户 需求 定义 

各 分 公司 用 户 视图 的 用 户 需求 定义 作为 两 个 部 分 列 出 : 第 一 部 分 描述 分 公司 用 户 视 图 使 
用 的 数据 。 第 二 部 分 提供 了 数据 怎样 被 分 公司 用 户 视图 使 用 的 例子 ( 即 员工 在 数据 上 执行 的 事 
务 )。 
(1) 数据 需求 
StayHome 的 一 个 分 公司 的 数据 包括 分 公司 地 址 ， 地 址 由 街道 、 城 市 、 州 、 邮 政 编 码 和 电 
话 号 码 组 成 ， 电 话 号 码 最 多 3 行 。 每 个 分 公司 有 一 个 给 定 的 名 称 ， 在 全 公司 是 唯一 的 。 

StayHome 的 每 个 分 公司 都 有 若干 员工 ， 包 括 一 个 经 理 ， 一 到 多 名 监理 和 一 些 其 他 员工 。 
经 理 负责 分 公司 的 日 常 运营 ， 监 理 负责 监督 员工 ， 员 工 数据 包括 姓名 、 职 务 、 薪 水 。 每 位 员 
工 有 员工 号 码 ， 在 全 公司 是 唯一 的 。 ， 

每 个 分 公司 有 录像 库存 。 录 像 数 据 包括 目录 号 、 录 像 号 、 片 名 、 种 类 、 日 租 费 用 、 购 买 
价格 、 状 态 、 主 要 演员 名 字 (以 及 扮演 的 角色 ) 和 导演 。 目 录 号 唯一 地 表示 一 盘 录 像 。 通 常 
一 个 分 公司 有 一 盘 录 像 的 多 份 拷贝 ， 每 个 拷贝 由 录像 号 唯一 地 表示 。 录 像 的 种 类 有 动作 、 成 
人 、 儿 童 、 恐 怖 、 科 幻 。 状 态 指出 一 盘 录 像 的 某 份 拷贝 是 否 可 以 出 租 。 

在 从 公司 租借 录像 之 前 ， 客 户 必须 首先 注册 成 为 StayHome 当 地 分 公司 的 一 名 会 员 。 会 员 
信息 包括 姓名 、 地 址 和 注册 日 期 。 每 个 会 员 有 会 员 号 ， 会 员 号 对 所 有 分 公司 是 唯一 的 ， 而 且 
可 以 在 多 个 分 公司 使 用 同一 会 员 号 注册 。 负 责 注 册 该 会 员 的 员工 的 姓名 也 要 加 上 。 
注册 后 ,会 员 可 以 租借 录像 ， 一 次 最 多 租借 10 部 。 租 借 业 务 数据 包括 租借 号 、 会 员 的 全 
、 会 员 号 、 录 像 号 、 片 名 、 每 日 费用 、 租 出 的 日 期 和 归还 的 日 期 。 租 借 号 在 整个 公司 是 唯 
一 的 。 

(2) 事务 需求 

数据 录入 

a) 录入 一 个 新 分 公司 的 详细 情况 。 

b) 录入 某 分 公司 的 新 员工 的 详细 情况 (如 分 公司 B001 的 Tom Daniels )。 

c) 录入 新 发 行 的 录像 的 详细 情况 (如 《Return of the King》 的 详细 情况 )。 

由 录入 给 定 分 公司 的 某 部 新 录像 拷贝 的 详细 情况 (如 分 公司 B001 的 《Return of the King》 的 
三 份 拷贝 )。 

e) 录入 某 分 公司 的 新 会 员 的 详细 情况 (如 Bob Adams 在 分 公司 B002 注 册 )。 

f) 录入 会 员 录 像 的 租借 协议 的 详细 情况 (如 会 员 Don Nelson 在 2004 年 5 月 4 日 租借 《Return 
of the King》) 。 

数据 更 新 /删除 

g) 更 新 /删除 分 公司 信息 。 

h) 更 新 /删除 某 分 公司 的 员工 信息 。 

iD 更 新 /删除 给 定 录 像 的 信息 。 

j) 更 新 /删除 给 定 录 像 的 某 份 拷贝 的 信息 。 

k) 更 新 /删除 给 定 会 员 的 信息 。 

D 更 新 /删除 某 会 员 租 借 某 部 录像 的 租借 协议 的 信息 。 

数据 查询 

数据 库 必须 支持 下 列 查询 : 

m) 列 出 给 定 城市 的 分 公司 情况 。 
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n) 按照 员工 的 名 字 顺 序列 出 指定 分 公司 的 员工 名 称 、 职 务 、 薪 水 。 

0) 按照 分 公司 号 顺序 列 出 每 个 分 公司 的 经 理 名 称 。 

p) 分 类 列 出 某 分 公司 的 录像 名 称 、 种 类 和 可 租借 情况 。 

q) 按照 片 名 硕 序 列 出 某 分 公司 指定 演员 的 录像 名 称 、 种 类 和 是 否 可 以 租借 。 

D 按照 片 名 顺序 列 出 某 分 公司 指定 导演 的 录像 名 称 、 种 类 和 是 否 可 以 租借 。 

s) 列 出 某 个 会 员 租借 的 全 部 录像 的 详细 情况 。 

b 列 出 某 个 分 公司 指定 录像 的 拷贝 情况 。 

u) 列 出 指定 种 类 的 所 有 录像 名 称 ， 按 片 名 排序 。 

v) 列 出 每 个 分 公司 每 种 录像 的 数量 ， 按 照 分 公司 号 排序 。 

w) 列 出 所 有 分 公司 的 录像 的 价值 。 . 

x) 列 出 每 个 演员 的 录像 数量 ， 按 照 演员 名 字 排 序 。 

y) 列 出 每 个 分 公司 在 1999 年 注册 的 会 员 的 数量 ， 按 照 分 公司 号 排序 。 

z) 列 出 每 个 分 公司 可 能 的 租金 收入 ， 按 照 分 公司 号 排序 。 

5. 创建 StayHome 的 数据 库 系 统 的 系统 说 明 

系统 说 明 应 该 列 出 该 数据 库 系统 的 所 有 的 重要 特点 ， 应 该 在 系统 说 明 中 描述 的 特点 举例 
如 下 : 

。 初 始 数据 库 大 小 。 

。 数 据 库 增长 速度 。 

。 记 录 查 找 的 类 型 和 平均 数量 。 

* 网络 和 数据 共享 需求 。 

。 性 能 。 

。 安 全 性 。 

。 备 份 和 恢复 。 

。 用 户 界面 。 

。 合 法 问题 。 

初始 数据 库 大 小 

a) 大 约 有 20000 种 录像 和 400000 盘 供出 租 的 录像 分 布 在 超过 100 个 分 公司 中 。 每 个 分 公司 
平均 有 4000 盘 录像 ， 最 多 有 10000 盘 供出 租 。 

b) 大 约 有 2000 名 员工 工作 在 各 个 分 公司 。 每 个 分 公司 平均 有 15 名 员工 ， 最 多 有 25 名 。 

c) 大 约 有 100000 名 会 员 在 各 个 分 公司 注册 。 每 个 分 公司 平均 有 1000 名 会 员 ， 最 多 有 1500 
名 会 员 。 

d) 各 个 分 公司 大 约 有 400000 盘 录像 供出 租 。 平均 每 个 分 公司 有 4000 到 10000 盘 录像 。 

e) 大 约 有 1000 名 导演 和 30000 名 主要 演员 出 演 60000 个 角色 。 

9 大 约 有 50 个 录像 供应 商 和 1000 盘 录像 订单 。 

数据 库 增长 速度 

a) 每 月 大 约 有 100 部 新 片 ， 每 部 录像 有 20 份 拷贝 加 到 数据 库 中 。 

b) 一旦 某 盘 录像 的 一 份 拷贝 不 能 再 租借 出 去 (如 画面 质量 差 、 丢 失 、 被 偷 )， 则 相应 的 记 
录 从 数据 库 中 删除 。 每 月 大 约 有 100 个 这 样 的 记录 。 

c) 每 月 会 有 20 名 员工 加 入 或 者 离开 。 离 开 公司 一 年 的 员工 记录 从 数据 库 中 删除 。 每 月 大 
约 删除 20 条 员工 记录 。 
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d) 每 月 大 约 有 1000 名 新 会 员 注册 。 如 果 一 个 会 员 两 年 没有 租借 任何 录像 ， 将 删除 该 会 员 
记录 。 每 月 大 约 有 100 条 会 员 记 录 被 删除 。 

e) 每 天 各 分 公司 总 共有 5000 条 新 的 录像 出 租 记 录 。 录 像 出 租 记 录 在 创建 两 年 后 被 删除 。 

f) 每 个 星期 大 约 有 50 份 新 的 录像 购买 订单 。 订 单 记录 在 创建 两 年 后 被 删除 。 

记录 查找 的 类 型 和 平均 数量 

a) 查询 分 公司 的 详细 情况 一 一 大 约 1 天 10 次 。 

b) 查询 一 个 分 公司 的 员工 详细 情况 一 一 大 约 每 天 20 次 。 

c) 查询 指定 录像 的 情况 一 一 每 天 约 5000 次 ( 周 日 到 周 四 ) ，10000 次 〈 周 五 和 周 六 )。 每 天 
下 午 的 6 点 ~9 点 是 高 峰 时 期 。 

d) 查询 某 盘 录像 的 某 份 拷贝 的 情况 一 一 每 天 约 10000 次 〈 周 日 到 周 四 )，20000 次 ( 周 五 和 
周 六 )。 每 天 的 上 午 6 点 ~9 点 是 高 峰 时 期 。 

e) 查询 指定 会 员 的 详细 情况 一 一 每 天 大 约 100 次 。 

f) 查询 会 员 租 借 录像 的 详细 情况 一 一 每 天 约 10000 次 ( 周 日 到 周 四 )，20000 次 ( 周 五 和 周 
六 )。 每 天 的 下 午 6 点 ~9 点 是 高 峰 时 期 。 - 

网 络 和 共享 访问 需求 

a) 所 有 分 公司 都 必须 安全 地 和 位 于 西雅图 公司 总 部 的 中 央 数 据 库 实现 网 络 互 连 。 

b) 系统 必须 能 够 支持 每 个 分 公司 的 至 少 三 名 成 员 同 时 访问 。 需 要 考虑 这 么 大 数量 并 发 访 
间 的 许可 需求 。 

性 能 

a) 在 上 班 时 间 但 不 是 高 峰 期 的 时 候 要 求 单个 记录 的 搜索 时 间 少 于 1 种 ， 在 高 峰 期 各 种 搜索 
响应 时 间 少 于 5 秒 (每 天 下 午 6 点 ~9 点 )。 

b) 在 上 班 时 间 但 不 是 高 峰 期 的 时 候 要 求 多 条 记录 的 搜索 时 间 少 于 5 秒 ， 在 高 峰 期 各 种 多 记 
录 搜 索 响 应 时 间 少 于 10 秒 (每 天 下 午 6 点 ~9 点 )。 

c) 在 上 班 时 间 但 不 是 高 峰 期 的 时 候 要 求 更 新 /保存 记录 的 时 间 少 于 1 秒 ， 在 高 峰 期 少 于 5 种 
(每 天 下 午 6 点 ~9 点 )。 

安全 性 

a) 数据 库 必 须 有 口令 保护 。 

b) 每 个 员工 应 该 分 配 一 个 到 特定 用 户 视图 的 数据 库 访 问 权限 ， 主 要 是 主管 、 经 理 、 监 理 、 
助理 和 采购 员 。 

c) 员工 只 能 在 适合 他 们 完成 工作 的 需要 的 窗口 中 看 到 需要 的 数据 。 

备份 和 恢复 

数据 库 必 须 在 每 天 半夜 12 点 备份 。 

用 户 界面 | 

用 户 界面 必须 是 菜单 驱动 的 ， 联 机 帮助 应 该 易于 查找 和 使 用 。 

法 律 问题 | 

每 个 国家 都 有 法 律 管理 个 人 数据 的 计算 机 存储 的 方式 。 作为 容纳 员工 和 会 员 信 息 的 
StayHome 数 据 库 ， 必 须 调查 并 且 实 现 所 要 遵守 的 法 律 。 


6.4.5 ”StayHome 案 例 研 究 一 一 数据 库 设 计 
本 章 我 们 说 明了 分 公司 用 户 视图 的 用 户 需 求 说 明 的 创建 和 StayHome 数 据 库 系 统 的 系统 说 
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明 的 创建 。 这 些 文档 是 下 一 个 阶段 一 -数据 库 设 计 的 信息 源 。 在 第 9 章 、 第 10 章 和 第 12 章 ~ 第 
16 章 ， 我 们 将 一 步 一 步 提供 数据 库 设 计 的 方法 学 ， 并 且 使 用 本 章 创建 的 有 关 StayHome 案 例 研 
究 的 文档 来 从 实践 上 说 明 这 些 方法 学 。 

如 果 你 对 开发 复杂 的 多 用 户 视图 的 数据 库 系 统 感 兴趣 ,我们 在 附录 C 中 演示 了 使 用 
StayHome 的 分 公司 和 业务 用 户 视图 时 视图 集成 的 方法 工作 情况 。 


6.5 本 章 小 结 


。 事 实 发 现 是 使 用 面谈 和 问卷 调查 等 技术 来 收集 有 关系 统 、 需 求 和 偏好 的 事实 的 形式 化 处 
理 过 程 。 

。 事 实 发 现 对 于 数据 库 系统 开发 生命 周期 的 早期 阶段 ， 包 括 数据 库 规划 、 系 统 定义 、 需 求 
收集 和 分 析 ， 都 是 至 关 重 要 的 。 

。 五 个 最 常用 的 事实 发 现 技术 是 检查 文档 、 面 谈 、 观 察 业务 处 理 、 研 究 和 问卷 调查 。 

。 数 据 库 规划 阶段 的 第 一 步 是 清楚 定义 数据 库 工程 的 任务 陈述 和 任务 目标 。 任 务 陈述 定义 
了 数据 库 系统 的 主要 目的 。 每 个 任务 目标 必须 确定 一 个 数据 库 必 须 支 持 的 特定 任务 。 

。 系 统 定义 阶段 的 目的 是 定义 数据 库 系 统 的 边界 和 用 户 视图 。 

“在 需求 收集 和 分 析 阶 段 要 产生 两 种 主要 文档 ， 即 用 户 需 求 说 明和 系统 说 明 。 

。 用 户 需求 说 明 详细 描述 了 数据 库 中 的 数据 和 数据 的 使 用 。 

。 系 统 说 明 描述 了 数据 库 系 统 的 所 有 特征 ， 如 要 达到 的 性 能 和 安全 级 别 。 


复习 题 


6.1 简要 叙述 事实 发 现 达 到 数据 库 开 发 人 员 要 求 的 过 程 。 

6.2 叙述 事实 发 现 是 如 何 贯穿 在 数据 库 系统 开发 生命 周期 的 各 阶段 的 。 

6.3 对 于 数据 库 系统 开发 生命 周期 的 每 个 阶段 ， 确 定 事实 捕获 的 示例 和 产生 的 文档 。 

6.4 在 一 个 数据 库 项 目 中 ,数据库 开发 人 员 通常 使 用 几 种 事实 发 现 技术 ， 五 种 最 常 使 用 
的 技术 是 检查 文档 、 面 谈 、 观 察 操作 中 的 业务 、 进 行 研究 和 使 用 问卷 形式 。 描 述 每 
种 事实 发 现 技术 并 确定 每 种 技术 的 优 缺 点 。 

6.5 描述 为 数据 库 系 统 定义 任务 说 明和 任务 目标 的 目的 。 

6.6 系统 定义 阶段 的 目的 是 什么 ? 

6.7 用 户 的 需求 说 明和 系统 说 明 在 内 容 上 有 何 差别 ? 

6.8 描述 在 开发 多 用 户 视图 的 数据 库 系统 时 ， 怎 样 确定 使 用 集中 化 方法 、 视 图 集成 方法 
或 两 者 的 结合 的 方法 ? 





第 7 章 实体 -关系 建 模 


本 章 主 题 : 

。 在 数据 库 设 计 中 怎样 使 用 ER 建 模 。 

。ER 模 型 中 的 基本 概念 : 实体 、 关 系 和 属性 。 

。 显 示 ER 模 型 的 图 形 技术 。 

。 怎 样 辨别 和 解决 在 ER 模型 中 可 能 出 现 的 连接 陷阱 的 问题 。 

在 第 6 章 ， 我 们 学 习 了 收集 和 捕获 用 户 对 数据 库 应 用 程序 的 需求 信息 的 技术 。 一 旦 完成 了 
数据 库 系统 开发 生命 周期 中 的 需求 收集 和 分 析 阶 段 的 工作 ， 并 且 把 数据 库 需 求 整 理 成 了 文档 ， 
就 可 以 开始 进行 数据 库 设 计 了 。 

数据 库 设 计 最 困难 的 一 个 方面 就 是 设计 人 员 、 程 序 员 和 最 终 用 户 看 待 和 使 用 数据 的 方式 
不 同 。 遗 憾 的 是 ， 除 非 我 们 能 够 获得 反映 公司 运行 的 共性 的 理解 ， 否 则 ， 我 们 的 设计 将 达 不 
到 用 户 的 要 求 。 为 了 保证 能 够 准确 理解 数据 的 本 质 ， 理 解 公司 使 用 这 些 数据 的 方法 ， 我 们 需 
要 有 一 个 通信 模型 ， 这 个 模型 和 技术 实现 无 关 ， 且 没有 二 义 性 。ER (Entity-Relationship, 实 
体 一 关系 ) 模型 就 是 一 个 这 样 的 例子 。 白 从 ER 模型 在 1976 年 问世 之 后 ， 已 经 扩展 到 包含 一 些 
高 级 建 模 概念 。 这 一 章 将 学 习 基 本 的 ER 模型 概念 ， 在 第 11 章 介绍 一 些 更 流行 的 概念 。 

ER 建 模 是 一 种 自 上 而 下 的 数据 库 设 计 方法 。 我 们 通过 标识 模型 中 必须 要 表示 的 重要 数据 
(叫做 实体 ) 以 及 数据 间 的 关系 开始 ER 建 模 ， 然 后 增加 细节 信息 ， 如 实体 和 关系 所 要 具有 的 
信息 (叫做 属性 )， 以 及 实体 、 关 系 和 属性 上 的 限制 。 

整个 这 一 章 ， 我 们 介绍 建立 一 个 ER 模型 的 基本 概念 。 虽 然 ， 对 各 个 概念 的 含义 有 一 些 泛 
化 协定 , 但 在 一 张 图 中 , 仍然 有 不 同 的 方式 来 表示 同一 个 概念 。 我 们 选择 使 用 图 形 化 的 表示 法 ， 
它 使 用 更 常用 的 面向 对 象 建 模 语言 ， 称 为 UML。 其 他 的 ER 模型 使 用 的 符号 在 附录 A 中 列 出 。 


UML (Unified Modeling Language， 统 一 建 模 语 言 ) 是 20 世 纪 80 年 代 和 90 年 代 产 


生 的 许多 面向 对 象 分 析 和 设计 方法 的 继承 者 ， 它 是 标准 建 模 语 言 。 


由 于 ER 模型 构成 了 第 9 章 、 第 10 章 和 第 12 章 ~ 第 16 章 介绍 的 方法 学 的 基础 ， 因 此 本 章 可 能 将 是 本 
书 最 重要 的 章节 之 一 。 如 果 你 不 能 马上 理解 这 些 概念 ， 不 要 着 急 ， 再 阅读 一 遍 ， 然 后 看 看 我 们 在 方 
法 中 提供 的 例子 以 获得 更 多 的 帮助 。 让 我 们 先 开 始 介绍 ER 模型 的 基本 概念 ， 即 实体 、 关 系 和 属性 。 


7.1 实体 








实体 (Entity) 一 组 有 相同 属性 的 对 象 ， 被 用 户 或 者 团体 标识 为 独立 存在 的 对 象 的 集合 。 


ER 模型 的 一 个 基本 概念 是 实体 ， 代 表 一 组 现实 世界 中 的 对 象 集合 ， 它 们 有 相同 的 属性 。 
每 个 对 象 必 须 在 集合 中 被 唯一 地 标识 表示 ， 叫 做 实体 事件 (entity occurrence)。 一 个 实体 是 独 
立 存在 的 ， 代 表 一 组 物理 存在 (现实 ) 或 者 概念 存在 (抽象 ) 的 对 象 的 集合 ， 如 图 7-1 所 示 。 

我 们 用 一 个 唯一 的 名 字 和 一 些 特征 (叫做 属性 ) 来 标识 每 个 实体 。 虽 然 一 个 实体 有 不 间 
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的 属性 集合 ， 但 是 每 个 实体 对 每 个 属性 都 有 自己 的 值 。 一 个 数据 库 通 常 包含 许多 不 同 的 实体 。 





图 7-1 具有 物理 存在 和 概念 存在 的 实体 的 例子 


实体 的 图 形 化 表示 | 
每 个 实体 用 矩形 来 表示 ， 在 和 矩形 框 中 写 上 实体 的 名 字 ， 名 字 通 常 是 一 个 名 词 。 在 UML 中 
每 个 单词 的 第 一 个 字母 大 写 。 图 7-2 显 示 了 实体 Video、Role、Actor 的 图 形 化 表示 。 











图 7-2 实体 Video、Role、Actor 的 图 形 化 表示 


7.2 关系 





关系 (Relationship) 实体 之 间 的 具有 某 种 含义 的 关联 。 


一 个 关系 是 特定 实体 之 间 的 一 组 关联 。 和 实体 一 样 ， 每 个 关系 在 集合 中 也 要 被 唯一 地 标 
识 。 一 个 可 以 唯一 标示 的 关联 叫做 关系 事件 (relationship occurrence ) 。 

每 个 关系 有 一 个 名 字 ， 此 名 字 描 述 关系 的 功能 。 例如 ， 实 体 Actor 与 实体 Role 通过 关系 
Play 关联 ， 实 体 Role 与 实体 Video 通 过 关系 Features 关 联 。 

关系 的 图 形 化 表示 | 

每 个 关系 显示 为 连接 关联 实体 的 一 条 线 ， 并 用 关系 的 名 字 标 记 。 通 常 ， 关 系 用 动词 (如 
Plays 或 Features) 或 者 动词 短语 (如 IsPartOf 或 WorksAt) 命名 。 关系 名 短语 的 第 一 个 字母 大 
写 。 只 要 有 可 能 ， 在 给 定 的 ER 模型 中 ， 关 系 名 应 该 唯一 。 

一 个 关系 仅 在 一 个 方向 标记 ， 代表 关系 仅 在 一 个 方向 起 作用 (例如 Actor Plays Role 有 意义 ， 但 
是 Role Plays Actor 没 有 )。 因 此 ， 一 旦 选择 了 关系 名 ， 必须 在 名 字 旁 边 加 箭头 指示 正确 的 方向 ， 以 
便 给 读者 解释 关系 名 的 意义 。 图 7-3 展 示 了 关系 Video Features Role 和 Actor Plays Role 的 图 形 化 表示 。 


“Video Features Role’ “Actor Plays Role 


Features > 埃 Plays 





图 7-3 Video Features Role 和 Actor Plays Role 关系 的 图 形 化 表示 
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7.2.1 关系 的 度 


关系 的 度 (Degree of a Relationship) 在 关系 中 参与 的 实体 的 数目 。 





包含 在 特定 关系 中 的 实体 叫做 参与 者 。 在 关系 中 参与 者 的 数目 叫做 关系 的 度 ， 它 指明 了 
参与 在 一 个 关系 中 的 实体 的 数目 。 度 数 为 1 的 关系 称 为 一 元 关系 ， 它 通常 被 称 为 递归 关系 。 在 
后 面 的 几 节 中 我 们 将 详细 讨论 这 种 关系 。 一 个 度数 为 2 的 关系 叫做 二 元 关系 ， 在 图 7-3 中 显示 
的 两 个 关系 的 度数 都 是 2。 度 数 超过 2 的 关系 称 为 复杂 关系 。 

一 个 度数 为 3 的 关系 叫做 三 元 关系 ， 例 如 有 三 方 实体 Branch、Staff、Member 参 与 的 
Registers， 如 图 7-4 所 示 。 这 个 关系 的 目的 是 表示 一 个 员工 在 某 个 部 门 注册 一 个 会 员 ， 人 允许 会 
员 在 多 个 部 门 注册 ， 而 且 会 员 可 以 在 分 公司 间 移 动 。 


‘Staff registers a 
member at a branch’ 





图 7-4 名 为 Registers 的 三 元 关系 的 例子 
一 个 度 为 4 的 关系 叫 四 元 关系 ， 更 高 度 的 关系 叫做 n 元 关系 。 我 们 遇 到 的 最 多 的 关系 类 型 
是 二 元 关系 ， 但 是 偶尔 也 会 遇 到 三 元 和 四 元 关系 。 
7.2.2 递归 关系 


递归 关系 (Recursive Relationship) ”在 不 同 的 角色 中 有 多 次 具有 相同 实体 参与 的 关系 。 


让 我 们 考虑 一 个 叫 Supervises 的 递归 关系 ， 此 关系 代表 员工 和 监理 之 间 的 关系 。 在 这 里 ， 
监理 也 是 员工 中 的 一 员 。 换 名 话说， Staff 实 体 参与 Supervises 关 系 两 次 : 第 一 次 作为 监理 参与 ， 
第 二 次 作为 一 名 被 管理 的 员工 参与 。 如 图 7-5 所 示 。 












Supervisee 





Supervises 


‘Staff (supervisor) supervisors 


Supervisor Staff (supervisee)’ 


图 7-5 名 为 Supervises 的 递归 关系 的 例子 
可 以 给 关系 一 个 角色 名 字 以 表明 每 个 参与 的 实体 在 关系 中 所 起 的 作用 。 角色 名 字 对 于 递 
归 关 系 决 定 参与 实体 的 作用 是 非常 重要 的 。 图 7-5 显 示 了 使 用 角色 名 字 来 描述 Supervises 递 归 
关系 。 在 Supervises 关 系 中 ， 实体 Staff 的 第 一 次 参与 给 定 的 角色 名 称 为 Supervisor， 第 二 次 参 
与 给 定 的 名 称 为 Supervisee。 


7.3 属性 


属性 (Attribute) 实体 或 者 关系 的 性 质 。 


实体 的 特定 性 质 叫做 属性 。 属性 代表 我 们 需要 知道 的 有 关 实 体 的 内 容 。 例 如 ， 实 体 Video 
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可 以 通过 catalogNo、title、category、dailyRental 和 price 等 属性 来 描述 。 这 些 属性 的 值 描述 了 
每 个 录像 的 现状 ， 并 代表 了 存储 在 数据 库 中 的 数据 的 主要 来 源 。 


实体 之 间 的 关系 也 可 以 有 和 实体 类 似 的 属性 ， 但 是 我 们 将 推迟 到 7.6 节 再 讨论 关系 的 属性 。 





现在 我 们 讨论 的 属性 可 以 分 为 : 简单 属性 和 复合 属性 ， 单 值 属 性 和 多 值 属性 ， 还 有 派生 属性 。 
7.3.1 简单 属性 和 复合 属性 


简单 属性 (Simple Attribute) 仅 由 单个 元 素 组 成 的 属性 。 


简单 属性 不 能 被 进一步 划分 。 例 如 实体 录像 的 category 和 price 属 性 就 是 简单 属性 。 简 单 属 
性 有 时 候 叫做 原子 属性 。 


复合 属性 (Composite Attribute) 由 多 个 元 素 组 成 的 属性 。 








复合 属性 可 以 被 进一步 划分 为 多 个 独立 存在 的 更 小 的 元 素 。 例 如 ， Member 实 体 的 name 属 
性 ， 县 有 值 为 Don Nelson 的 时 候 ， 可 以 被 划分 为 {Name (‘Don’) 和 IName (‘Nelson’ )。 


把 name 属 性 建 模 成 简单 属性 还 是 分 解 成 {Name 和 IName 的 复合 属性 ， 取 决 于 用 户 访 


问 name 是 作为 一 个 整体 单元 还 是 单个 组 成 元 素 访问 。 





7.3.2 单 值 属性 和 多 值 属性 


单 值 属性 (Single-Valued Attribute) 对 一 个 实体 只 有 一 个 值 的 属性 。 


对 于 一 个 具体 的 实体 来 说 ， 大 多 数 属性 是 单 值 属性 。 例 如 ， 每 个 Video 实 体 的 出 现 只 有 一 
个 catalogNO 属 性 值 (例如 ，207132)， 因 此 被 看 做 单 值 属性 。 


对 于 一 个 实体 可 以 有 多 个 值 的 属性 。 


有 些 属性 对 某 个 特定 实体 具有 多 个 值 。 例 如 ， 对 每 个 Video 实 体 category 属 性 可 能 有 多 个 
值 ，( 例 如 ‘Childrem* 和 ‘Comedy’ )， 因 此 ， 在 这 里 category 就 是 多 值 属 性 。 一 个 多 值 属性 可 以 
有 一 组 具有 指定 上 下 限 的 值 。 例 如 ，category 属 性 有 1 到 3 个 值 。 

简单 和 复合 属性 ， 单 值 和 多 值 属性 的 分 类 不 是 相互 排斥 的 。 换 名 话说， 属性 可 能 有 简单 
的 单 值 属 性 、 复 合 的 单 值 属性 、 简 单 的 多 值 属性 和 复合 的 多 值 属性 。 


7.3.3 派生 属性 














多 值 太 性 (Multi-Valued Attribute ) 


派生 属性 (Derived Attribute) ”属性 值 代表 一 个 从 相关 属性 或 者 属性 集 派生 的 值 ， 在 相 


同 实体 中 不 是 必须 的 属性 。 


有 些 属性 可 能 和 一 个 特定 实体 相关 。 例 如 ， 一 位 员工 的 年 龄 (age) 是 从 他 的 出 生日 期 
(DOB) 导出 的 ， 因 此 age 和 DOB 属 性 是 相关 的 。 我 们 把 年 龄 属性 看 作 派生 属性 ， 它 的 值 从 出 
生日 期 得 到 。 


提示 年 龄 通常 不 存储 在 数据 库 中 ， 因为 必须 要 对 这 个 值 进行 有 规则 的 更 新 。 另 外 ， 由 
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于 生日 不 会 改变 ， 因 此 年 龄 可 以 从 生日 属性 导出 ， 所 以 可 以 存储 生日 ， 然 后 ， 当 需要 
的 时 候 ， 将 年 龄 从 生日 属性 中 导出 。 


在 某 些 情况 下 ， 一 个 属性 的 值 从 一 个 实体 中 的 值得 到 ， 例 如 年 龄 。 但 是 某 些 情况 下 ， 属 
性 值 可 能 要 从 多 个 实体 中 才能 得 到 。 


7.3.4 键 
在 2.2.3 节 ， 我 们 介绍 了 与 表 相关 的 键 的 概念 ， 这 些 概念 同样 适用 于 实体 。 
超 键 (Superkey) ”可 以 唯一 标识 一 个 实体 的 属性 或 者 属性 组 。 




















候选 键 (Candidate Key) 可 以 唯一 标识 一 个 实体 的 最 小 数目 的 属性 的 超 键 。 


主键 (Primary Key) 被 选中 作为 标识 实体 的 候选 键 。 





备用 键 (Alternate Key) 没有 被 选 为 主键 的 候选 键 . 


例如 ，branchNo (分 公司 号 码 ) 和 zipCode (分 公司 的 邮政 编码 ) 是 实体 Branch 的 候选 键 ， 
因为 对 这 两 个 值 ， 每 个 branch 实 体 的 存在 都 有 不 同 的 值 。 如 果 我 们 选择 branchNo 为 主键 ， 那 
么 zipCode 就 成 为 备用 键 。 

属性 的 图 形 化 表示 

如 果实 体 和 属性 一 起 显示 ， 那么 我 们 就 把 代表 实体 的 矩形 分 成 两 部 分 。 上 半 部 分 显示 实体 名 ， 
下 尘 部 分 列 出 属性 名 。 例 如 ， 图 7-6 显 示 了 Video、Role 和 Actor 实 体 以 及 它们 的 属性 的 ER 模型 









Actor 


character 





catalogNo {PK} 
title 

category [1..3} 
dailyRental 
price 


actorNo {PK} 
name - 
varme : 










IName 
DOB 
fage 















图 7-6 Video、Role 和 Actor 实 体 的 属性 的 图 形 化 表示 


如 果 已 经 知道 了 主键 ， 则 第 一 个 被 列 出 的 属性 是 实体 的 主键 ， 主键 属性 的 名 字 旁 可 以 加 
标记 {PK}。 在 UML 中 ， 属性 名 的 第 一 个 字母 是 小 写 ， 如 果 名 字 由 几 个 单词 组 成 ， 则 接 下 来 的 
每 个 单词 的 第 一 个 字母 用 大 写 (例如 ，character、actorNo、 catalogNo)。 可 以 使 用 的 附加 标 
记 包 括 部 分 主键 {PPK}， 这 表明 这 个 属性 仅仅 是 复合 主键 的 一 部 分 ， 还 有 备用 键 标记 {AK)} 。 


为 简单 起 见 ， 对 单 值 属性 ， 没 有 必要 使 用 标记 ， 我 们 只 要 简单 地 在 实体 名 字 的 下 边 把 属 
性 名 显示 成 一 个 列表 即 可 。 
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对 于 复合 属性 ， 可 以 列 出 复合 属性 的 名 字 ， 后 面 跟 着 组 成 元 素 的 名 字 ， 例 如 ， 图 7-6 显 示 
的 复合 属性 name 后 面 紧 跟 着 组 成 姓名 的 属性 fName 和 1Name。 

对 于 多 值 属性 ， 我 们 标记 出 属性 名 ， 并 且 指 出 适用 于 该 属性 的 取 值 范围 。 例 如 ， 我 们 用 
[1..*] 标 记 category 属 性 ， 其 意思 是 属性 category 的 值 有 一 个 到 多 个 。 如 果 我 们 知道 属性 值 的 准 
确 的 最 大 数目 ， 我 们 可 以 用 一 个 精确 的 值 来 标记 属性 名 。 例 如 ， 如 果 属 性 category 可 以 有 一 个 
到 最 多 三 个 值 ， 我 们 可 以 用 [1..3] 来 标记 它 。 

对 于 派生 属性 ， 我 们 在 属性 的 名 字 前 面 加 前 级“/”， 例 如 ， 图 7-6 中 用 /age 显 示 派 生 属性 age。 

注意 没有 为 Role 实体 指定 主 码 。 主 键 的 存在 或 不 存在 允许 我 们 表示 实体 是 强 实 体 还 是 

弱 实 体 。 下 面 讨论 强 实体 和 弱 实 体 。 

对 于 简单 的 数据 库 应 用 ， 可 以 为 数据 模型 的 每 个 实体 显示 属性 。 但 是 对 于 复杂 的 数据 库 
应 用 ， 通常 只 需 显示 主键 。 当 在 ER 模型 中 只 显示 主键 属性 时 ， 可 以 不 使 用 {PK} 标 记 。 


7.4 强 实体 和 弱 实 体 
我 们 可 以 把 实体 分 为 强 实体 和 弱 实 体 。 
强 实体 (Strong Entity) 不 依赖 于 另 一 个 实体 的 主键 的 实体 。 

弱 实 体 (Weak Entity) ”部 分 或 全 部 依赖 于 其 他 一 个 或 多 个 实体 的 主键 而 存在 的 实体 。 


例如 ， 不 用 任何 其 他 实体 的 存在 ， 我 们 就 可 以 把 一 个 演员 (actor) 和 其 他 演员 区 分 开 ， 
把 一 部 影片 (video) 和 其 他 影片 区 分 开 ， 因 此 Actor 实 体 和 Video 实 体 是 强 实体 。 换 名 话说， 
Actor 实 体 和 Video 实 体 是 强 实体 是 因为 他 们 有 自己 的 主键 ， 如 图 7-6 所 示 。 

图 7-6 中 也 有 一 个 弱 实体 的 例子 叫做 Role， 代 表演 员 在 影片 中 扮演 的 角色 。 如 果 没 有 Actor 
实体 和 Video 实 体 的 存在 就 不 能 唯一 标识 一 个 Role 实体 的 存在 ， 我 们 把 Role 实体 叫做 弱 实 体 。 
即 ，Role 实 体 是 弱 实 体 是 因为 它 没 有 自己 的 主键 。 

强 实体 有 时 候 被 叫做 父 实体 、 拥 有 者 实体 或 者 统治 实体 ， 而 弱 实 体 则 相应 被 叫做 子 实体 、 
依赖 实体 或 者 从 属实 体 。 


7.5 关系 的 多 样 性 约束 


现在 我 们 检查 可 以 放置 到 参与 关系 的 实体 上 的 约束 。 这 种 约束 的 例子 包括 : 一 个 分 公司 
必须 有 多 名 会 员 ， 每 个 分 公司 都 必须 有 员工 。 关 系 上 的 主要 的 约束 类 型 称 为 多 样 性 。 


多 样 性 (Multiplicity) 一 个 实体 中 可 能 和 相关 实体 的 一 个 存在 关联 的 实体 事件 的 数目 。 


多 样 性 约束 了 通过 特定 关系 关联 其 他 实体 的 实体 事件 的 数目 。 多 样 性 代表 了 用 户 或 者 公 
司 建立 的 策略 ， 被 称 为 业务 规则 (business rule)。 这 些 规则 确保 所 有 合适 的 事务 规则 都 被 标 
识 并 且 被 表达 是 为 公司 建 模 的 一 个 重要 部 分 。 

前 面 我 们 提 到 过 ， 最 常用 的 关系 是 度 为 2 的 二 元 关系 。 二 元 关系 上 的 多 样 性 约束 一 般 被 叫 
做 一 对 一 (1:1)、 一 对 多 (1:*) 或 者 多 对 多 (#:* )。 我 们 用 下 面 的 业务 规则 来 考察 这 三 种 类 
型 的 关系 。 

“一 名 员工 管理 一 个 分 公司 。 
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“一 个 分 公司 有 许多 员工 。 

* 演员 出 演 某 部 影片 。 | 

对 每 个 业务 规则 ， 我 们 说 明 怎 样 在 没有 明确 指定 的 情况 下 找到 其 中 的 多 样 性 约束 ， 并 说 
明 怎 样 在 ER 模型 中 表示 它们 。 在 7.5.4 节 中 ， 我 们 将 看 到 度数 更 高 的 关系 的 多 样 性 约束 。 


一 定 要 注意 不 是 所 有 的 业务 规则 都 可 以 非常 容易 的 在 ER 模型 中 清晰 地 表示 出 来 的 。 


例如 ， 一 名 员工 每 年 有 一 天 的 额外 假期 的 需求 就 很 难 清楚 地 在 ER 模型 中 表示 。 





7.5.1 一 对 一 关系 


让 我 们 考虑 关系 Manages ， 它 表示 实体 Staff 和 Branch 之 间 的 关系 。 图 7-7a 用 Staff 和 Branch 
实体 的 主键 属性 值 显示 了 Manages 关 系 的 一 个 例子 。 





弛 二 个 例子 Ly 
每 个 分 公司 由 员工 员工 中 的 一 个 成 员 可 以 


中 的 一 个 成 员 管 理 管理 0 个 或 多 个 分 公司 





b) 多 样 性 
图 7-7 Staff Manages Branch 关 系 


1. 找 出 多 样 性 

找 出 多 样 性 通常 需要 用 样 例 数据 检查 特定 事务 规则 的 数据 之 间 的 关系 。 我 们 可 以 从 填 好 
的 表格 、 报 表 甚 至 从 与 用 户 的 讨论 中 得 到 样 例 数据 。 为 了 得 到 正确 的 结论 ， 强 调 被 检查 和 讨 
论 的 样 例 数据 能 够 真实 地 代表 所 有 数据 是 非常 重要 的 。 

在 图 7-7a 中 ， 我 们 可 以 看 到 staffNo 为 $1500 管 理 branchNo 为 B001 的 分 公司 ， 并 且 staffNo 为 
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S0010 管 理 branchNo 为 B002 的 分 公司 ,但 是 S0003 没 有 管理 任何 分 公司 。 换 句 话说 ， 一 名 员工 可 
以 管理 0 到 1 个 分 公司 ， 一 个 分 公司 仅 由 一 名 员工 管理 。 由 于 在 这 个 关系 中 ， 对 每 个 员工 最 多 只 
有 一 个 分 公司 ， 而 对 每 个 分 公司 最 多 只 有 一 名 员工 ， 我 们 把 这 种 类 型 的 关系 叫做 一 对 一 关系 ， 
简写 为 1 : 1。 

2.1 :1 关系 的 图 形 化 表示 

Staff Manages Branch 关 系 的 ER 模型 见 图 7-7b， 为 了 表示 一 名 员工 可 以 管理 0 到 1 个 分 公司 ， 
我 们 在 从 Staff 实 体 开 始 的 关系 的 另 一 端 放置 一 个 “0..1”。 为 了 表示 一 个 分 公司 只 有 一 名 经 理 ， 
我 们 在 从 Branch 实 体 开始 的 关系 的 另 一 端 写 上 “1..1”( 注 意 ， 对 于 一 个 1:1 关 系 ， 我 们 也 可 以 
选择 在 两 个 方向 上 都 有 意义 的 关系 名 )。 


7.5.2 一 对 多 关系 


让 我 们 考虑 叫做 “有 ”(Has) 的 关系 ， 同 样 还 使 用 Branch 和 Staff 实 体 间 的 关系 。 图 7-8a 
使 用 Staff 和 Branch 实 体 的 主键 属性 值 显示 了 Branch Has Staff 关 系 的 一 个 例子 。 


Has | 





a) 一 个 例子 


员工 中 的 每 个 成 员 都 每 个 分 公司 都 有 
在 一 个 分 公司 工作 一 个 或 多 个 员工 





b) 多 样 性 
图 7-8 Branch Has Staff(1:*) 关 系 


1. 找 多 样 性 约束 

在 图 7-8a 中 ， 我 们 看 到 branchNo 为 B001 的 分 公司 有 员工 S0003、 S1500， 而 branchNo 为 
B002 的 分 公司 有 员工 S0010、S3250。 因 此 每 个 分 公司 都 有 一 到 多 名 员工 ， 每 名 员工 只 在 一 个 
Re 由 于 一 个 分 公司 可 以 有 多 名 员工 ， 所 以 我 们 把 这 种 类 型 的 关系 叫做 一 对 多 关系 ， 
简写 由)5 


第 7 章 实体 一 类 夭 建 檬 101 


2. 1:* 关 系 的 图 形 化 表示 

关系 Branch Has Staff 的 ER 模型 如 图 7-8b 所 示 。 为 了 表示 每 个 分 公司 都 有 一 到 多 个 员工 ， 
我 们 在 Staff 端 放 一 个 标记 “1..*”， 而 在 Branch 端 放 一 个 “1..1” 表 示 一 名 员工 只 能 在 一 个 分 公 
司 工作 (注意, 在 1:* 关 系 上 ， 我 们 选择 在 1:* 方 向 上 有 意义 的 名 字 )。 


提示 如 果 你 知道 多 样 性 约束 的 最 大 值 和 最 小 值 ， 则 可 以 显示 这 些 信息 。 例 如 ， 假 如 一 
个 分 公司 有 2~10 名 员工 ， 则 可 以 用 “2..10” 代 替 “1..*”。 
7.5.3 多 对 多 关系 


现在 考虑 PlaysIn 关 系 ， 它 关联 实体 Actor 和 Video。 图 7-9 用 Actor 和 Video 实 体 的 主键 属性 
值 表 示 了 Actor Playsln Video 关 系 的 例子 。 





a) 一 个 例子 
每 部 电影 里 都 有 每 个 演员 出 演 
0 个 或 多 个 演员 了 多 部 电影 





b) 多 样 性 


图 7-9 Actor PlaysIn Video(*:*) 关 系 
1. 找 多 样 性 约束 
在 图 7-9a 中 ,我 们 可 以 看 到 actorNo 为 2019 的 演员 在 catalogNo 为 634817 和 445624 的 录像 中 
出 演 过 ，ActorNo 为 7525 的 演员 在 catalogNo 为 445624 录 像 中 出 演 过 。 换 句 话 说 ， 一 名 演员 可 
以 在 一 到 多 部 影片 中 出 演 角色 。 我 们 也 可 以 看 到 catalogNo 为 445624 的 录像 有 两 名 演员 ， 但 是 
catalogNo 为 781132 的 录像 中 没有 任何 演员 ， 我 们 可 以 推断 一 部 影片 中 可 以 有 0 到 多 个 演员 。 
总 之 ， 从 实体 Actor 和 Video 两 个 实体 视角 来 看 ， 关 系 PlaysIn 都 是 1:* 的 。 我 们 用 两 个 方向 
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上 的 1:* 来 代表 这 种 关系 ， 总 体 上 叫做 多 对 多 关系 ， 简 写 为 *:*。 

2. *:# 关 系 的 图 形 化 表示 

关系 Actor PlaysIn Video 的 ER 模型 如 图 7-9b 所 示 。 为 了 表示 每 个 演员 都 可 以 在 多 部 电影 中 
出 演 ， 我 们 在 从 Actor 实 体 开 始 的 关系 的 另 一 端 放 上 标记 “1:*”。 为 了 表示 每 部 影片 有 0 到 多 个 
演员 ， 我 们 在 从 Video 开 始 的 关系 的 另 一 端 放 上 标记 “0:*”。 


7.5.4 复杂 关系 的 多 样 性 约束 


多 元 关系 中 的 多 样 性 约束 稍微 复杂 一 点 。 例 如 ， 三 元 关系 的 多 样 性 约束 表示 在 关系 中 当 
其 他 两 个 实体 事件 的 数目 固定 的 情况 下 ， 另 一 个 实体 的 潜在 的 数目 。 让 我 们 再 考虑 图 7-4 表 示 
的 由 实体 Branch、Staff 和 Member 参 与 的 三 元 关系 Registers ， 图 7-10a 表 示 了 当 Staff 和 Member 
的 值 固 定 的 情况 下 Registers 关 系 的 例子 。 

找 出 多 样 性 

在 图 7-10a 中 ， 我们 可 以 看 到 对 于 每 个 staffNo/memberNo 的 值 对 的 组 合 ， 总 是 至 少 有 一 个 
对 应 的 branchNo 值 。 当 值 对 staffNo/memberNo 为 S0003/M166884 时 对 应 branchNo B001 和 B002。 
这 表示 会 员 M166884 已 经 在 分 公司 B001 由 员工 S003 注 册 ， 接 着 又 在 B002 分 公司 由 同一 名 员工 
注册 ， 说 明 这 名 员工 已 经 由 B001 分 公司 调 到 B002 分 公司 。 换 句 话 说 ， 从 Branch 的 观点 来 看 多 
样 性 约束 是 1:*。 

如 果 我 们 从 实体 Staff 的 观点 重复 这 个 检验 ， 我 们 发 现 这 个 关系 的 多 样 性 约束 是 1:1， 从 
Member 的 观点 是 0..*。 显 示 Registers 关 系 的 多 样 性 约束 的 ER 模型 如 图 7-10b 所 示 。 


一 般 来 说 ，D 元 关系 的 多 样 性 约束 代表 关系 中 其 他 n-1 元 固定 的 情况 下 某 个 实体 潜 





在 的 实体 事件 的 数目 。 





R 





egisters b> 







“ Staff registers a 


member at a branch’” 


b) 关系 的 多 样 性 
图 7-10 ”在 Staff 和 Member 值 固定 的 情况 下 来 自 Branch 的 三 元 Registers 关 系 
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表示 多 样 性 约束 的 所 有 可 能 的 方法 的 总 结 见 表 7-1， 此 表 还 描述 了 每 个 方法 的 含义 。 


表 7-1 表示 多 样 性 约束 的 方法 总 结 
ww -一 一 





表示 多 样 性 约束 的 方法 含义 
0..1 0 或 者 1 个 实体 事件 
1..1 (或 仅 1) 1 个 实体 事件 
0..* 《或 仅 *) 0 或 者 多 个 实体 事件 
1..* 1 个 或 者 多 个 实体 事件 
5..10 最 少 5 个 最 多 10 个 实体 事件 
0、3、6~8 0 个 、3 个 、6、7、8 个 实体 事件 


7.5.5 基数 约束 与 参与 约束 
实际 上 ， 多 样 性 约束 由 基数 约束 和 参与 约束 组 成 。 
基数 (Cardinality ) 描述 每 个 可 能 参与 实体 的 关系 的 数目 。 





参与 (Participation) 决定 是 否 所 有 的 或 仅 有 的 某 些 实体 在 关系 中 发 生 参 与 。 


二 元 关系 的 基数 就 是 我 们 所 说 的 一 对 一 、 一 对 多 、 多 对 多 。 参 与 约束 表示 是 否 所 有 的 实体 
事件 都 参与 关系 强制 参与 ) 或 者 只 有 部 分 参与 (可 选 参与 )。 在 图 7-11 中 ， 我 们 展示 了 在 图 
7-7b 中 的 关系 Staff Manages Branch 的 基数 和 参与 约束 。 在 逻辑 数据 库 设 计 中 我 们 将 使 用 参与 
约束 来 决定 : 

“怎样 为 一 对 一 关系 创建 表 ( 见 步 难 2.1)。 

* 外 键 是 否 可 以 为 空 〈 见 步骤 2.4)。 

一 个 分 公司 由 一 个 员 
工 的 成 员 进 行 管理 





员工 中 的 一 个 成 员 


管理 一 个 分 公司 










基数 (1:1D) 上 


Branch 





1 





所 有 分 公司 都 被 管理 不 是 所 有 的 员工 都 管理 分 公司 
(强制 参与 ) (可 选 参与 ) 
图 7-11 以 关系 Staff Manages Branch (图 7-7b 中 显示 的 1:1 关 系 ) 
的 基数 和 参与 约束 的 形式 显示 的 多 样 性 
7.6 关系 上 的 属性 


在 7.3 节 中 我 们 简单 的 提 到 ， 关 系 也 可 以 有 属性 。 例 如 ， 考 虑 Playsin 关 系 ， 它 关联 实体 
Actor 和 Video， 我 们 也 可 能 关心 演员 在 影片 中 所 扮演 的 角色 。 这 个 信息 是 和 PlaysIn 关 系 相关 
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联 而 不 是 和 实体 Actor 或 者 Video 关 联 。 我 们 创建 了 一 个 叫做 character 的 属性 来 存储 这 个 信息 ， 
并 把 它 分 配 到 PlaysIn 关 系 中 ， 如 图 7-12 所 示 。 注 意 ， 在 图 中 ，character 属 性 是 用 实体 的 符号 
表示 的 。 为 了 区 分 实体 和 关系 的 属性 ， 代 表 属 性 的 矩形 与 关系 用 虚线 连接 。 
与 关系 相关 的 一 个 或 者 多 个 属性 也 许 说 明 关系 隐藏 了 一 个 没有 识别 出 的 实体 。 例 如 ， 在 
前 面 的 图 7-6 中 显示 的 实体 Role 相 关联 的 属性 character。 
演员 在 影片 中 扮演 一 个 角色 


< 
1 


图 7-12 具有 属性 character 的 PlayIn 关 系 


PlaysIn 


7.7 ”ER 模型 中 的 设计 问题 


本 节 我 们 说 明 设 计 一 个 ER 模型 可 能 会 出 现 的 两 个 问题 。 这 些 问 题 总 体 上 被 称 为 连接 陷阱 ， 
通常 是 由 于 对 某 些 关系 的 含义 的 误解 而 产生 的 。 连 接 陷阱 的 主要 两 种 类 型 是 扇形 陷阱 和 深 坑 
陷阱 。 我 们 将 举例 说 明 怎 样 识别 和 解决 这 类 问题 。 

总 之 ， 为 了 识别 连接 陷阱 ， 我 们 必须 确信 关系 的 含义 ( 它 表 示 的 业务 规则 ) 被 完全 理 
解 并 且 清 楚 地 定义 。 如 果 我 们 不 能 理解 关系 ， 可 能 就 会 建立 一 个 不 能 代表 现实 世界 的 
模型 。 


7.7.1 扇形 陷阱 


扇形 陷阱 (Fan Trap) ”从 第 三 个 实体 肩 出 的 两 个 实体 有 1:* 关 系 ， 但 这 两 个 实体 之 间 应 


该 有 直接 关系 以 提供 必要 的 信息 。 





扇形 陷阱 存在 于 从 同一 个 实体 扁 出 的 两 个 或 者 多 个 一 对 多 关系 中 。 图 7-13a 说 明了 一 个 
汶 在 的 扇形 陷阱 ， 它 显示 了 两 个 1:* 关 系 (Has 和 IsAssigned)， 它们 从 同一 个 实体 Branch 射 出 。 
这 个 模型 告诉 我 们 一 个 分 公司 有 许多 员工 并 且 分 配 了 许多 车 。 然 而 ， 如 果 我 们 想 知 道 哪 个 
成 员 使 用 哪 辆 车 ， 问 题 就 产生 了 。 为 了 理解 这 个 问题 ， 让 我 们 检查 Has 和 IsAssigned 关 系 
的 一 些 例 子 。 这 些 例 子 使 用 的 实体 分 别 用 Branch、 Staff 和 Car 的 主键 属性 值 来 表示 ， 如 图 
7-13b 所 示 。 

假如 我 们 试 着 回答 这 个 问题 : 哪 名 员工 使 用 SH34 号 汽车 ， 用 当前 的 结构 是 不 可 能 给 出 一 
个 明确 的 答案 的 。 我 们 只 能 决定 汽车 SH34 分 配给 了 B001 分 公司 ， 但 是 不 能 判断 员工 S0003 和 
S1500 是 否 使 用 这 辆 汽车 。 不 能 明确 地 回答 这 个 问题 是 因为 扇形 陷阱 的 缘故 。 

通过 给 ER 模型 增加 一 个 Staff Uses Car 关 系 ， 如 图 7-13c 所 示 ， 我 们 可 以 解决 这 个 问题 ， 
现在 检查 Has、 IsAssigned 和 Uses 关 系 的 例子 ， 我 们 可 以 看 到 S1500 使 用 SH34， 如 图 7-13d 
所 示 。 
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添加 uses 关 系 来 解 
决 扇形 陷阱 


0) 扇形 陷阱 的 解决 





d) Branch Has Staff、Branch IsAssigned Car 和 Staff Uses Car 关 系 的 例子 。 
现在 可 以 说 明 哪个 员工 使 用 此 汽车 


图 7-13 扇形 陷阱 及 其 相关 问题 
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7.7.2 深 坑 陷阱 


深 坑 陷阱 (Chasm Trap) ”一 种 模型 ， 假 设 两 个 实体 之 间 存 在 关系 ， 但 这 些 实体 之 间 不 


存在 路 径 。 


深 坑 陷 阱 可 能 出 现 的 地 方 是 存在 可 选 参与 的 关系 组 成 了 相关 实体 之 间 的 路 径 。 图 7-14a 举 
例 说 明了 一 个 潜在 的 深 坑 陷 阱 的 情况 。 图 中 显示 了 实体 Branch、Car 和 Staff 之 间 的 关系 。 这 个 
模型 告诉 我 们 一 个 分 公司 分 到 了 多 辆 汽车 ， 一 名 员工 可 以 使 用 一 辆 汽车 。 特 别 的 要 注意 不 是 
所 有 的 员工 都 可 以 使 用 汽车 。 当 我 们 想 知 道 一 名 员工 在 哪 一 个 分 公司 工作 的 时 候 会 产生 一 个 
问题 。 为 了 理解 这 个 问题 ， 我 们 检查 用 Branch、Car 和 Staff 的 主键 属性 的 值 代表 的 关系 
IsAssigned 和 Uses 的 例子 ， 如 图 7-14b 所 示 。 

如 果 我 们 想 回 答 这 个 问题 : 员工 S0003 在 哪个 分 公司 工作 ?利用 当前 的 结构 我 们 不 能 知道 ， 
因为 不 是 所 有 的 员工 都 使 用 汽车 。 不 能 回答 这 个 问题 是 因为 缺少 信息 (我们 知道 员工 必须 在 
某 个 分 公司 工作 ) ， 这 是 深 坑 陷阱 的 结果 。Staff Uses Car 关 系 中 的 staff 可 选 参与 意味 着 有 些 员 
工 不 能 通过 使 用 汽车 和 一 个 分 公司 关联 起 来 。 

因此 ， 为 了 解决 这 个 问题 ， 需 要 消除 深 坑 陷阱 ， 我 们 在 实体 Branch 和 Staff 之 间 增 加 了 一 
个 Has 关 系 ， 如 图 7-14c 所 示 。 现 在 我 们 检查 7-14d 中 所 示 的 关系 Has、IsAssigned 和 Uses 的 例子 ， 
我 们 知道 员工 S0003 在 B001 分 公司 工作 。 

本 章 介绍 的 ER 模型 的 概念 对 于 建立 一 个 复杂 的 数据 库 应 用 有 时 候 可 能 还 不 够 用 。 在 第 11 
章 我 们 将 介绍 一 些 更 加 普及 的 和 ER 建 模 相关 的 概念 ， 你 将 发 现 对 更 加 复杂 的 数据 建 模 时 ， 那 
些 概念 是 非常 有 用 的 。 8 








b) Branch IsAssigned Car 和 Staff Uses Car 关 系 的 例子 。 
不 能 说 明 员工 S0003 在 哪个 分 公司 工作 


图 7-14 深 坑 陷阱 及 其 相关 问题 
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添加 Has 关 系 解决 
次 坑 陷 阱 





0) 解决 深 坑 陷阱 





d) Branch Has Staff 、Branch IsAssigned Car 和 Staff Uses Car 关 系 的 例子 。 
现在 可 以 说 明 员工 在 哪个 分 公司 工作 下 


图 7-14 ( 续 ) 
7.8 本 章 小 结 


“实体 是 具有 相同 性 质 的 一 组 对 象 ， 这 些 性 质 是 用 户 或 者 组 织 作为 独立 存在 标识 。 一 个 唯 
一 可 以 标识 的 对 象 称 为 实体 事件 。 

“关系 是 实体 之 间 的 有 意义 的 关联 。 一 个 唯一 可 以 标识 的 关联 叫做 关系 事件 。 

“ 关系 的 度 是 关系 中 参与 的 实体 的 数目 。 
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“递归 关系 是 在 一 个 关系 中 同一 个 实体 以 不 同 的 角色 多 次 参与 。 

* 属性 是 实体 或 者 关系 的 性 质 。 

“简单 属性 仅 由 一 个 元 素 组 成 。 

“复合 属性 由 多 个 简单 元 素 组 成 。 

“ 单 值 属性 对 于 一 个 实体 事件 仅 拥有 一 个 值 。 

* 多 值 属 性 对 一 个 实体 事件 拥有 多 个 值 。 

“ 派生 属性 代表 一 个 从 相关 属性 或 者 属性 组 导出 的 值 ， 它 在 实体 中 不 是 必须 的 。 

* 强 实 体 不 依赖 于 其 他 实体 的 存在 来 获得 主键 ， 弱 实体 部 分 或 者 全 部 依赖 于 其 他 实体 来 获 

得 主键 。 

* 多 样 性 约束 定义 了 可 能 和 单个 相关 实体 事件 发 生 关系 的 实体 事件 的 数 日 。 

“多样 性 由 两 个 约束 组 成 ,一 个 是 基数 约束 , 它 描述 了 对 每 个 参与 实体 的 可 能 的 关系 的 数目 

男 一 个 是 参与 约束 ， 它 决定 了 在 一 个 关系 中 是 所 有 的 实体 事件 还 是 部 分 实体 事件 参与 。 

“如果 从 第 三 个 实体 扇 出 的 两 个 实体 有 1 : * 关 系 时 出 现 扇形 陷阱 ， 但 这 两 个 实体 之 间 应 访 

有 直接 关系 以 提供 必要 的 信息 。 

“* 深 坑 陷 阱 提示 在 实体 之 间 存 在 一 个 关系 ， 但 是 在 特定 实体 事件 之 间 的 路 径 不 存在 ， 
复习 题 

7.1 描述 在 ER 模型 中 实体 的 含义 ， 并 给 出 一 个 物理 或 概念 上 存在 的 实体 的 例子 。 

7.2 描述 在 ER 模型 中 关系 的 含义 ， 并 给 出 一 个 一 元 、 二 元 和 三 元 关系 。 

73 描述 在 ER 模型 中 属性 的 含义 ， 并 给 出 一 个 简单 属性 、 复 合 属性 、 单 值 属性 、 多 值 属 

”性 和 派生 属性 。 

7.4 描述 一 个 关系 中 的 多 样 性 的 含义 。 

7.5 什么 是 业务 规则 ， 多 样 性 如 何 对 这 些 约束 建 模 ? 

7.6 在 一 个 关系 中 ， 多 样 性 如 何 表达 基数 约束 和 参与 约束 ? 

7.7 给 出 有 属性 的 一 个 关系 的 例子 。 

7.8 描述 强 实体 和 弱 实 体 的 区 别 ， 并 给 出 每 种 实体 的 一 个 例子 。 

7.9 描述 在 ER 模型 中 如 何 出 现 扇形 陷阱 和 深 坑 陷阱 ， 并 给 出 解决 的 办 法 。 


练习 


7.10 为 下 述 每 个 描述 创建 一 个 ER 图 : 
(a) 每 个 公司 有 四 个 部 门 ， 每 个 部 门 只 属于 一 个 公司 ， 
(b) 每 个 部 门 有 一 个 或 多 个 雇员 ， 并 且 每 个 雇员 只 为 一 个 部 门 工作 。 
(0) 每 个 雇员 可 以 没有 或 者 有 一 个 或 多 个 助手 ， 每 个 助手 属于 一 个 雇员 
(d) 每 个 雇员 没有 或 者 有 一 个 工作 经 历 . 
(e) 用 一 个 ER 图 表达 (a)、 (b)、(c) 和 (qd) 中 描述 的 内 容 。 

7.11 创建 一 个 表达 IT 培训 公司 所 需 数据 的 ER 图 。 读 公司 有 30 名 教师 ， 每 个 培训 学 期 可 以 
党 训 最 多 100 名 学 员 。 公 司 提供 五 门 高 级 技术 课程 ， 其 中 每 门 课程 由 两 个 或 多 个 教师 
组 成 的 培训 小 组 教授 。 每 个 教师 最 多 被 分 配 在 两 个 培训 小 组 中 ， 也 可 以 不 分 配 到 任 
何洁 训 小 组 中 而 进行 研究 工作 。 每 个 培训 学 员 在 每 个 培训 学 期 参加 一 门 高 级 技术 课 








7.12 
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程 。 
(a) 标识 此 公司 的 主要 实体 。 

(b) 标识 主要 的 关系 并 指明 每 个 关系 的 多 样 性 。 陈 述 你 关于 数据 的 假设 。 

(c) 使 用 你 对 (a) 和 (b) 的 答案 ， 画 出 表达 此 公司 的 数据 需求 的 ER 图 。 

阅读 下 面 的 描述 EasyDrive School of Motoring 的 数据 需求 的 案例 研究 : 

EasyDrive School of Motoring 1992 年 成 立 于 Glasgow (格拉 斯 如 (英国 ))。 从 
那 之 后 ， 学 校 开始 稳步 发 展 ， 现 在 已 经 在 Scotland (苏格兰 ) 的 主要 城市 有 了 几 个 
办 事 处 ， 每 个 办 事 处 有 一 个 经 理 (经理 也 可 以 是 高 级 教师 (Senior Instructor))、 几 
个 高 级 教师 (Senior Instructor)、 教 师 (Instructor) 和 行政 人 员 。 经 理 负 责 办 事 处 
每 日 的 运作 。 客 户 必 须 首先 在 办 事 处 注册 ， 他 们 要 先 填写 一 张 申 请 表 ， 申 请 表 中 记 
录 了 他 们 的 个 人 信息 。 一 个 客户 可 能 需要 单独 的 课程 或 者 预订 一 些 课 程 。 单 独 的 课 
程 需要 一 个 小 时 ， 整 个 过 程 都 在 办 事 处 完成 。 每 节 课 程 在 给 定 的 时 间 有 一 个 特定 的 
教师 和 特定 的 车 辆 。 课 程 可 以 从 时 8 点 开始 到 晚 8 点 结束 。 每 节 课 程 结束 后 ， 教 师 记 
录 客 户 的 学 习 进展 并 记录 这 节 课 程 走 的 英里 数 。 学 校 有 一 个 汽车 库 ， 可 以 根据 教学 
目的 挑选 合适 的 汽车 。 给 每 个 教师 分 配 一 个 特定 的 车 辆 。 一 旦 准备 好 ， 客 户 可 以 申 
请 驾驶 考核 时 间 。 为 了 获得 驾照 ， 客 户 必须 通过 实践 的 和 理论 的 测试 ， 如 果 客 户 没 
有 通过 考试 ， 教 师 必 须 记录 失败 的 原因 。 

(a) 标识 EasyDrive School of Motoring 的 主要 实体 。 
(b) 标识 (a) 中 描述 的 实体 间 的 主要 关系 ， 并 将 每 个 关系 绘制 成 一 个 ER 图 。 
(c) 为 (b) 中 描述 的 每 个 关系 确定 多 样 性 约束 ， 并 在 (b) 中 创建 的 ER 图 中 表达 每 个 关系 

的 多 样 性 。 

(d) 标识 实体 和 关系 的 属性 ， 在 (c) 中 创建 的 ER 图 中 表达 这 些 属性 。 

(e) 为 每 个 ( 强 ) 实体 确定 候选 键 和 主键 属性 。 

( 使 用 你 在 (a)j~(e) 的 答案 ， 试 着 在 一 个 ER 图 中 表达 EasyDrive School of Motoring 的 
数据 需求 ， 说 明 支 持 你 的 设计 的 任何 设想 。 





第 8 章 规范 化 


本 章 主 题 : 

* 存在 元 余数 据 的 表 在 更 新 异常 的 时 候 有 什么 表现 ， 这 可 能 将 不 一 致 性 引入 数据 库 。 

。 最 经 常 使 用 的 规范 化 规则 ， 即 第 一 范式 (1NF)、 第 二 范式 (2NF) 和 第 三 范式 (3NF)。 

* 不 符合 INF、2NF 或 3NF 的 表 怎样 含有 宛 余 数据 ， 在 更 新 异常 时 有 什么 后 果 。 

。 怎 样 重建 不 符合 INF、2NF、3NF 的 表 。 

在 前 面 的 章节 里 ， 我 们 学 习 了 ER 建 模 方法 ， 一 个 泛 化 的 自 上 而 下 的 数据 库 设 计 方 法 。 这 
一 章 ， 我 们 考虑 另外 一 种 泛 化 的 数据 库 设 计 的 方法 ， 叫 做 规范 化 。 在 数据 库 设 计 中 ， 规 范 化 
可 以 有 两 种 使 用 方法 。 第 一 种 是 把 规范 化 用 做 自 下 而 上 的 数据 库 设 计 方 法 ， 第 二 种 是 把 规范 
化 方法 与 ER 建 模 结合 起 来 使 用 。 

把 规范 化 作为 自 下 而 上 的 方法 包括 分 析 属 性 之 间 的 关联 ， 基 于 这 个 分 析 ， 把 属性 组 合 在 
一 起 形成 代表 实体 和 关系 的 表 。 然 而 ， 当 属性 很 多 的 时 候 ， 这 种 方法 很 难 使 用 ， 因 为 很 难 建 
立 属 性 之 间 的 所 有 重要 的 关联 。 

由 于 这 些 原 因 ， 这 本 书 提供 了 一 种 方法 ， 建 议 应 该 先 使 用 自 上 而 下 的 数据 库 设计 方法 ， 先 


把 ER 模型 翻译 成 代表 数据 的 一 组 表 。 在 这 一 点 我 们 使 用 规范 化 方法 检查 表 的 设计 是 否 良好 。 
本 章 的 目的 是 解释 规范 化 在 数据 库 设 计 中 是 一 个 有 用 的 技术 的 原因 ， 还 要 特别 介绍 如 何 
使 用 规范 化 从 ER 模型 来 构建 表 的 结构 。 


8.1 简介 


规范 化 (Normalization ) 一 种 用 来 产生 表 的 集合 的 技术 ， 这 些 表 具有 符合 要 求 的 属性 ， 


并 能 支持 用 户 或 公司 的 需求 。 





1972 年 ，E.F.Codd 博 士 提出 了 规范 化 技术 来 支持 基于 关系 模型 的 数据 库 设计 。 规 范 化 通 
常 作 为 对 表 结构 的 一 系列 测试 来 决定 它 是 否 满足 或 符合 给 定 范式 。 存 在 几 种 范式 形式 ,但 最 
常用 的 是 第 一 范式 (INF)、 第 二 范式 (2NF) 和 第 三 范式 (3NF)。 所 有 这 些 范式 都 是 基于 在 
表 中 的 列 之 间 的 关系 的 。 

在 以 下 的 内 容 中 ， 我 们 首先 指出 引起 数据 元 余 的 错误 的 结构 化 表 是 怎样 导致 问题 的 出 现 
的 ， 这 些 问题 叫做 更 新 异常 。 错 误 的 结构 化 表 可 能 产生 于 原始 ER 模型 或 在 将 BR 模型 转化 成 表 
时 出 现 错误 。 然 后 我 们 给 出 第 一 范式 (1NF)、 第 一 范式 (2NF) 和 第 三 范式 (3NF) 的 定义 ， 
并 解释 每 个 范式 是 怎样 用 来 确定 和 更 正 表 中 的 不 同类 型 的 问题 的 。 


8.2 数据 元 余 和 更 新 异常 


关系 数据 库 设计 的 一 个 主要 目的 是 把 列 组 合成 表 使 数据 的 宛 余 最 小 ， 并 减少 实现 基 去 
(《 基 表 的 定义 参见 2.3.2 节 ) 所 需 的 文件 存储 空间 。 为 了 说 明 与 数据 元 余 有 关 的 问题 ， 我 们 来 比 





较 图 8-1 的 Staff 和 Branch 表 与 图 8-2 的 StaffBranch 表 。 


Staff 





Tom Daniels Manager 
Sally Adams Assistant 
Mary Martinez Manager 


Robert Chin Supervisor 


Sally Stern Manager 


Art Peters Manager 


BOO1 


8 Jefferson Way, Portland, OR 97201 503-555-3618 
BO02 City Center Plaza, Seattle, WA 98122 206-555-6756 , 
B003 14 - 8th Avenue, New York, NY 10012 212-371-3000 
BOO4 16 - 14th Avenue, Seattle, WA 98128 206-555-3131 





图 8-1 Staff 和 Branch 表 





Tom Daniels Manager 8 Jefferson Way, Portland, OR 97201 503-555-3618 
Sally Adams Assistant 8 Jefferson Way, Portland, OR 97201 503-555-3618 


Mary Martinez | Manager City Center Plaza, Seattle, WA 98122 206-555-6756 
Robert Chin Supervisor City Center Plaza, Seattle, WA 98122 206-555-6756 
Sally Stern Manager 16 - 14th Avenue, Seattle, WA 98128 206-555-3131 
Art Peters Manager 14 - 8th Avenue, New York, NY 10012 !; 212-371-3000 





图 8-2 StaffBranch 表 

StaffBranch 表 是 Staff 表 和 Branch 表 一 种 替换 模式 。 此 表 有 以 下 结构 ， 每 一 个 表 的 主键 
(主键 的 定义 参见 2.2.3 节 ) 用 下 划 线 标识 

Staff (staffNo, name, position， salary, branchNo) 

Branch (branchNo, branchAddress，telNo) 

StaffBranch (staffNo, name， Boston ， salary， branchNo， branchAddress， telNo) 

在 StaffBranch 表 中 有 宛 余数 据 ， 因 为 分 公司 的 细节 信息 在 分 公司 的 每 个 员工 那里 被 重复 
了 一 遍 。 而 在 Branch 表 中 ， 每 一 个 分 公司 的 详细 信息 仅 出 现 一 次 ， 而 且 在 Staff 表 中 只 有 分 公 
司 编号 (branchNo) 被 重复 ， 它 用 来 指出 每 个 员工 属于 哪个 分 公司 。 有 元 余数 据 的 表 可 能 有 
的 问题 叫做 更 新 异常 ， 它 分 为 插入、 删除 和 更 改 异 常 。 


8.2.1 插入 异常 


有 两 种 主要 的 插入 异常 ， 我 们 用 图 8-2 的 StaffBranch 表 来 说 明 。 

。 为 了 播 入 一 新 员工 到 StaffBranch 表 中 ， 我 们 必须 包括 分 公司 的 详细 信息 ， 这 个 信息 决定 新 
员工 属于 的 分 公司 。 例 如 ， 要 插入 在 B003 分 公司 工作 的 新 员工 ， 必 须 输入 B003 分 公司 的 
正确 的 细节 情况 使 得 与 StaffBranch 表 中 其 他 B003 分 公司 的 记录 信息 一 致 。 图 8-1 所 示 的 表 
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就 不 存在 这 种 六 在 的 不 一 致 性 ， 因为 对 于 每 一 个 员工 我 们 仅 需 加 入 正确 的 分 公司 号 到 Staff 
表 中 就 可 以 了 。 另 外 ， B003 分 公司 在 Branch 表 中 作为 单独 的 记录 在 数据 库 中 仅 记录 一 次 。 
。 如果 要 在 StaffBranch 表 中 插入 一 个 新 的 、 目 前 还 没有 员工 的 分 公司 的 详细 信息 ， 需 要 在 
与 员工 有 关 的 列 ， 比 如 StaffNo， 输 入 空 值 。 但 由 于 StaffNo 在 StaffBranch 表 中 是 主键 ， 
输入 null 给 staffNo 就 违反 了 实体 完整 性 (实体 完整 性 定义 见 2.3.2 节 )， 因 此 不 允许 为 空 。 
图 8-1 所 示 的 表 的 设计 就 避免 了 这 个 问题 的 出 现 ， 因 为 在 Branch 表 中 插入 分 公司 情况 与 
员工 内 容 是 分 开 的 ， 在 有 了 分 公司 之 后 ， 就 可 以 在 以 后 插入 员工 到 Staff 表 中 。 


8.2.2 删除 异常 


如 果 我 们 从 StaffBranch 表 中 删除 一 个 记录 ， 而 它 又 是 一 个 分 公司 的 最 后 一 名 员工 ， 那 么 
关于 本 分 公司 的 其 他 情况 也 被 从 数据 库 中 删除 了 。 例 如 ， 如 果 我 们 从 StaffBranch 表 中 删除 员 
工 S0415('Art Peters') 的 记录 ， 那 么 与 B003 分 公司 相关 的 情况 也 从 数据 库 中 丢失 了 。 图 8-1 所 
示 的 表 的 设计 就 避免 了 这 个 问题 的 出 现 ， 因 为 在 分 公司 表 揪 入 的 分 公司 情况 与 员工 内 容 是 分 
开 的 ， 仅 仅 是 用 branchNo 列 把 两 个 表 关 系 起 来 。 如 果 从 Staff 表 中 删除 员工 S0415 的 记录 ， 那 么 
B003 分 公司 的 情况 在 Branch 表 中 依 提 不 受 影响 。 


8.2.3 更 新 异常 


如 果 我 们 想 在 StaffBranch 表 中 改变 一 个 特定 分 公司 的 一 个 列 的 值 ， 例 如 分 公司 B001 的 电 
话 号 码 ， 就 必须 更 改 在 那个 分 公司 的 所 有 员工 的 记录 。 如 果 此 次 更 改 没有 在 StaffBranch 表 中 
的 所 有 记录 中 正确 进行 ， 那 么 数据 库 就 变 得 不 一 致 了 。 在 这 个 例子 中 ,分 公司 B001 对 于 不 同 
的 员工 就 有 不 同 的 电话 号 码 。 

以 上 的 例子 表明 图 8-1 的 Staff 表 和 Branch 表 比 图 8-2 的 StaffBranch 有 更 大 的 预期 实用 性 。 在 
后 面 的 章节 中 我 们 将 说 明 范式 是 怎样 用 来 规范 化 表 的 定义 的 ， 使 这 些 表 有 预期 的 实用 性 并 且 
避免 潜在 的 更 新 异常 。 


8.3 第 一 范式 


第 一 范式 (First Normal Form, INF) 每 个 列 和 记录 包含 一 个 而 且 只 包含 一 个 值 的 表 。 





对 于 关系 数据 库 来 说 ， 只 有 第 一 范式 (1NF) 在 创建 适当 的 表 中 是 关键 的 。 所 有 接 


下 来 的 范式 都 是 可 选 的 。 但 是 ， 为 了 避免 在 8.2 节 中 所 讨论 到 的 更 新 异常 ， 通 常 建议 考 
不 第 三 范式 (3NF)。 





让 我 们 看 看 图 8-3 所 示 的 Branch 表 ， 其 主键 为 branchNo。 我 们 可 以 看 到 Branch 表 中 除了 
telNo 列 之 外 ， 其 他 的 列 都 遵守 1NEF 的 定义 ， 因 为 对 于 每 一 个 记录 的 telNo 列 有 多 个 值 。 例 如 分 
公司 号 为 B001 的 分 公司 有 三 个 电话 号 码 ，503-555-3618、 503-555-2727 和 503-555-6534。 因 此 
此 Branch 表 不 属于 1NF。 


注意 虽然 列 branchAddress 可 能 会 有 多 个 值 ， 但 地 址 的 这 种 表示 并 不 违反 INF。 在 这 个 
例子 中 ， 我 们 仅仅 简单 地 选择 了 把 一 个 地 址 的 详细 内 容 作 为 一 个 单独 的 值 。 


Nu 
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503-555-3618, 503-555-2727, 503-555-6534 
206-555-6756, 206-555-8836 
212-371-3000 
206-555-3131, 206-555-4112 


8 Jefferson Way, Portland, OR 97201 
City Center Plaza, Seattle, WA 98122 
14 - 8th Avenue, New York, NY 10012 










多 个 值 ， 所 以 
不 属于 INF LA 


图 8-3 Branch 表 不 是 1NF 的 一 个 例子 





转换 为 1NF 

为 了 把 Branch 表 转换 成 INF， 我 们 创建 一 个 单独 的 表 ， 叫 做 BranchTelephone， 此 表 用 来 
保存 分 公司 的 电话 号 码 。 此 表 是 把 telNo 列 从 Branch 表 中 去 掉 ， 同 时 把 Branch 表 的 主键 
(branchNo) 复制 到 新 表 中 。 新 表 BranchTelephone 的 主键 是 telNo。 8-4 所 示 的 是 更 改 了 的 
Branch 表 和 新 的 BranchTelephone 表 的 结构 。 现在 Branch 表 和 BranchTelephone 表 已 属于 1NF， 
因为 符合 每 一 个 表 的 每 一 个 记录 的 每 一 列 都 有 单独 的 值 这 一 标准 ， 


Branch( 不 属于 1NF) 





















ee 
503-555-3618, $03-555-2727, 503-555-6534 


206-555-6756, 206-555-8836 
212-371-3000 
206-555-3131, 206-555-4112 


删除 telNo 列 并 创建 
新 列 telNo 


8 Jefferson Way, Portland, OR 97201 
City Center Plaza, Seattie WA 98122 

14 - 8th Avenue, New York, NY 10012 
16 - 14th Avenue, Seattie, WA 98128 







BranchTelephone(1NF) 





503-555-3618 
503-555-2727 
S03-555-6534 
206-555-6756 


8 Jefferson Way, Portiand, OR 97201 
City Center Plaza, Seattle, WA 98122 

14 - 8th Avenue, New York, NY 10012 
16 -~ 14th Avenue, Seattie, WA 98128 







206-555-8836 
主键 212-371-3000 
206-555-3131 
206-555-4112 





变 为 外 键 变 为 主键 
图 8-4 由 于 将 Branch 表 中 的 teINo 列 移出 ， 并 创建 一 个 叫做 BranchTelephone 的 表 ， 使 Branch 成 为 INF 的 
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8.4 第 二 范式 


第 二 范式 仅仅 应 用 于 具有 复合 主键 的 表 ， 也 就 是 主键 是 由 两 个 或 多 个 列 复合 而 成 的 表 。 
具有 单列 主键 的 表 自 动 就 是 2NF 的 。 不 属于 2NEF 的 表 可 能 遇 到 8.2 节 中 讨论 的 更 新 异常 问题 。 


第 二 范式 (Second Normal Form, 2NF) 一 个 第 一 范式 的 表 并 且 每 个 非 主键 列 都 可 以 从 
构成 主键 的 全 部 的 列 得 到 。 


让 我 们 查看 图 8-5 所 示 的 TempStaffAllocation 表 。 这 个 表 指 出 了 在 每 个 分 公司 的 临时 工 每 
周 的 工作 时 间 。TempStaffAllocation 表 的 主键 由 StaffNo 和 branchNo 列 组 合 而 成 。 注 意 ， 我 们 
用 “ 非 主键 ” 列 来 表明 这 些 列 并 不 是 主键 的 一 部 分 。 例 如 ，TempStaffAllocation 表 中 的 非 主 键 
列 有 branchAddress (分 公司 地 址 )、name (名 字 )、position (职位 ) 和 hoursPerWeek (每 周 工 
作 小 时 )。TempStaffAllocation 表 下 面 所 示 的 箭头 指出 了 主键 列 和 非 主键 列 的 特定 关系 。 


在 图 8-5 中 所 示 的 TempStaffAllocation 表 的 列 之 间 的 特定 关系 更 加 形式 化 地 指出 了 功 
能 依赖 。 功 能 依赖 是 表 中 列 的 含义 的 性 质 ， 表 明了 各 列 是 如 何 相互 依赖 。 

例如 ， 假 设 一 个 表 含 有 列 A 和 列 B， 列 B 功 能 上 依赖 于 列 A (用 A 一 B 表 示 )。 如 果 我 们 #o 道 了 
A 的 值 ， 则 在 任何 时 候 ， 我 们 在 所 有 记录 中 只 能 找到 对 应 这 个 A 值 的 唯一 B 值 。 因 此 ， 当 两 个 记 
录 含 有 相同 的 A 值 的 时 候 ， 它 们 都 含有 相同 的 B 值 。 但 对 于 给 定 的 B 值 就 可 能 有 几 个 不 同 的 A 值 。 


我 们 看 到 TempStafftAllocation 表 含有 元 余数 据 ， 可 能 会 遇 到 8.2 节 中 描述 的 更 新 异 党。 例如， 要 
更 改 Ellen Layman 的 名 字 ， 我 们 不 得 不 更 改 TempStaffAllocation 表 中 的 两 条 记录 。 如 果 仅 更 改 了 一 条 ， 
数据 库 将 产生 不 一 致 性 。TempStaffAllocation 表 包含 元 余数 据 的 原因 是 这 些 表 不 符合 2NF 的 定义 。 

考虑 TempStaffAllocation 表 中 的 非 主 键 列 branchAddress，branchAddress 列 的 值 可 以 由 
branchNo 列 〈 主 键 的 一 部 分 ) 决定 。 换 句 话说 ，branchNo 列 中 的 每 个 唯一 的 值 在 
branchAddress 列 中 都 有 相同 的 值 。 例 如 ， 在 branchNo 列 中 每 次 出 现 B002 值 时 ， 在 
branchAddress 列 中 都 出 现 相 同 的 地 址 “City Center Plaza，Seattle ，WA 98122”。 

现在 让 我 们 来 看 看 非 主键 列 name 和 position。name 和 position 的 值 能 由 stafftNo 列 (主键 的 
一 部 分 ) 的 值 决 定 。 例 如 ， 在 staffNo 列 中 每 次 出 现 S4555 值 时 ，name 和 position 列 就 分 别 出 现 
名 字 Ellen Layman 和 地 址 Assistant。 

最 后 ， 让 我 们 查看 非 主键 列 hoursPerWeek。hoursPerWeek 列 的 值 是 由 staffNo 列 和 

branchNo 列 (主键 的 全 部 ) 一 起 决定 的 。 例 如 ， 在 每 次 staffNo 列 和 branchNo 列 中 分 别 出 现 
S4555 和 B002 值 时 ， 那 么 hoursPerWeek 列 的 值 就 是 16。 
第 二 范式 的 形式 化 定义 是 一 个 属于 第 一 范式 的 表 ， 并 且 它 的 每 一 个 非 主键 列 在 功 
能 上 都 完全 依赖 于 主键 。 完 全 功能 依赖 是 指 ， 如 果 B 不 依赖 于 A 的 任何 子 集 ， 则 B 完 全 
功能 依赖 于 A， 如 果 B 依 赖 于 A 的 子 集 ， 则 就 称 其 为 部 分 依赖 。 如 果 在 主键 中 存在 部 分 
依靠 ， 则 这 个 表 就 不 属于 2NF。 这 个 部 分 依赖 必须 在 表 中 去 掉 放 能 成 为 2NF。 
转换 到 2NF 

为 了 把 图 8-5 所 示 的 TempStaffAllocation 表 转化 成 2NF， 我 们 需要 删除 仅 由 主键 的 一 部 分 
决定 的 非 主 键 列 。 换 名 话说， 我 们 需要 删除 可 由 staffNo 或 者 branchNo 决 定 但 不 需要 两 者 共同 
决定 的 列 。 对 于 TempStaffAllocation 表 ， 这 就 意味 着 我 们 必须 删除 branchAddress、 name 和 
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position 列 ， 并 将 它们 放置 到 一 个 新 表 中 。 
为 此 ， 我 们 创建 两 个 新 的 表 分 别 叫 Branch 和 TempStaff。Branch 表 含有 描述 分 公司 情况 的 
列 ，TempStaff 表 包含 描述 临时 员工 情况 的 列 。 
* 通过 从 TempStaffAllocation 表 中 删除 branchAddress 列 ， 并 将 与 此 列 相 关 的 主键 列 (在 这 
里 为 branchNo) 复制 到 新 创建 的 Branch 表 中 。 
。 同 样 的 方法 ， 通过 从 TempStaffAllocation 表 中 删除 name 和 position 列 ， 同 时 复制 与 这 些 
列 相关 的 主键 列 (在 这 里 为 staffNo) 来 创建 TempStaff 表 。 


复合 主键 


TempStaffAllocation (不 是 2NF) 









City Center Plaza, Seattie WA 98122 
16 - 14th Avenue, Seattle, WA 98128 
City Center Plaza, Seattle, WA 98122 
16 - 14th Avenue, Seattie, WA 98128 

















将 branchAddress 
列 移 到 新 表 将 name 列 ”将 position 到 
移 到 新 表  ” 移 到 新 表 


` 4 复制 staffNo 列 到 复制 branchNo 列 
新 表 成 为 主键 ”到 新 表 成 为 主键 
Branch (2NF) ‘TempStaff (2NF) 


BOO2 City Center Plaza, Seattie, WA 98122 
B004 16 -~ 14th Avenue, Seattie, WA 98128 


变 成 主键 





了 
变 成 外 键 





变 成 外 键 


复合 主键 
图 8-6 由 于 删除 了 TempStaffAllocation 表 的 branchAddress、 name 和 position 列 ， 
并 创建 新 表 Branch 和 TempStaff 表 ， 使 TempStaffAllocation 成 为 2NF 的 


由 于 在 TempStaffAllocation 表 中 hoursPerWeek 列 的 存在 并 不 破坏 2NF 规 则 ， 因 此 不 必要 删 
除 此 列 。 为 确保 维护 临时 工 和 分 公司 间 的 关系 以 记录 临时 工 工作 的 小 时 总 数 ， 我 们 将 staffNo 
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和 branchNo 列 作为 TempStaffAllocation 表 的 外 键 。 

为 确保 维护 临时 工 和 他 所 工作 的 分 公司 之 间 的 关系 ， 我 们 将 staffNo 和 branchNo 列 作为 
TempStaff Allocation 表 的 外 键 。 : 

图 8-6 显 示 了 修改 后 的 TempStaffAllocation 表 的 结构 和 新 的 Branch 和 TempStaff 表 的 结构 。 
新 的 Branch 表 的 主键 是 branchNo， 新 的 TempStaff 表 的 主键 是 staffNo。 

由 于 TempStaff 表 和 Branch 表 都 只 有 单个 的 主键 列 ， 所 以 他 们 肯定 属于 2NF。 改 变 了 的 
TempstaffAllocation 表 也 属于 2NF， 这 是 因为 非 主键 列 hoursPerWeek 既 依赖 于 staffNo， 又 依赖 于 
branchNo。 


8.5 第 三 范式 
虽然 第 二 范式 比 第 一 范式 减少 了 很 多 数据 宛 余 ， 但 它们 可 能 仍然 遇 到 更 改 异 常 。 


第 三 范式 (Third Normal Form, 3NF) 一 个 已 经 是 第 一 和 第 二 范式 的 表 ， 并 且 所 有 的 非 
主键 列 的 值 都 只 能 可 以 从 主 码 列 得 到 ， 而 不 能 从 其 他 的 列 得 到 。 


让 我 们 看 一 下 图 8-2 所 示 的 StaffBranch 表 ， 它 的 主键 是 staffNo。 在 图 8-7 中 ， 我 们 指明 了 这 
个 表 中 的 列 间 的 特定 关系 。 我 们 可 以 看 到 ，StaffBranch 表 包含 宛 余数 据 ， 并 且 可 能 造成 8.2 节 
所 描述 的 更 新 异常 。 例 如 ， 要 改变 B001 分 公司 的 电话 号 码 ， 我 们 必须 修改 StaffBranch 表 中 的 
两 条 记录 ， 如 果 只 修改 了 一 条 记录 ， 则 数据 库 将 会 不 一 致 。 StaffBranch 表 包含 元 余数 据 的 原 
因 是 这 个 表 没 有 遵守 我 们 定义 的 3NF 标 准 。 






8 Jefferson Way, Portland, OR 97201 


8 Jefferson Way, Portland, OR 97201 

City Center Plaza, Seattle, WA 98122 

City Center Plaza, Seattle, WA 98122 

16 ~ 14th Avenue, Seattle, WA 98128 |206:555-3131 
“14 ~ 8th Avenue, New York, NY 10012 |212-371-3000 





所 有 非 主键 列 中 的 值 可 以 从 主键 staffNo 中 得 出 


branchAddress 列 和 telNo 列 的 值 可 以 从 branchNo 
中 得 出 ， 所 以 该 表 不 符合 3NF 
branchNo 和 telNo 列 的 值 可 以 从 branchAddress 获 
得 ， 所 以 该 表 不 符合 3NF 

branchNo 和 branchAddress 列 可 以 从 telNo 得 到 ， 
所 以 该 表 不 符合 3NF 


图 8-7 BranchManager 表 不 是 3NF 的 
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StaffBranch 表 不 是 3NE 的 ， 因 为 有 branchNo、 branchAddresss 和 telNo 列 。 尽 管 我 们 可 以 从 
主键 staffNo 得 到 员工 的 分 公司 号 、 分 公司 地 址 和 电话 号 码 ， 但 如 果 我 们 知道 分 公司 号 、 分 公 
司 地 址 或 分 公司 电话 号 码 ， 我 们 也 可 以 得 到 一 个 给 定 分 公司 的 详细 情况 。 换 句 话说 ， 我 们 可 
以 使 用 非 主键 列 (也 就 是 branchNo、branchAddress 或 telNo) 的 值得 到 信息 。 例 如 ， 对 于 
staffNo 列 中 值 为 S1500 的 行 ， 可 以 得 到 branchAddress 列 中 的 值 为 “8 Jefferson Way, Portland, 
OR 97201”。 但 对 于 branchNo 列 中 值 为 B001 的 行 ， 也 有 branchAddress 列 中 的 值 为 “8 Jefferson 
Way, Portland, OR 97201”。 也 就 是 说 ， 根 据 已 知 的 branchNo 的 值 可 以 得 到 员工 所 工作 的 地 址 。 
这 在 3NF 中 是 不 允许 的 ，3NE 要 求 所 有 的 非 主键 列 的 值 只 能 从 主键 列 的 值得 到 。 


第 三 范式 的 形式 化 定义 是 一 个 即 属于 第 一 范式 又 属于 第 二 范式 的 表 ， 并 且 它 的 非 主 
键 列 都 不 传递 依赖 于 主键 。 传 递 依赖 是 一 种 类 型 的 功能 依赖 ， 它 是 指 表 中 的 列 之 间 存 在 
特定 类 型 的 依赖 关系 。 

例如 ， 考 虑 一 个 含有 列 A，B，C 的 表 。 如 果 B 功 能 依赖 于 A (A 一 B)， 并 且 C 功 能 
依赖 于 B (BC)， 那 么 C 就 通过 B (即使 A 不 功能 依赖 于 B 或 C) 传递 依赖 于 A。 如 果 伟 
递 依赖 存在 于 主键 中 ， 这 个 表 就 不 属于 3NF。 这 个 传递 依赖 必须 在 表 中 删除 才能 转换 成 
3NE。 : 


转换 到 3NF 

要 将 图 8-7 所 示 的 StaffBranch 表 转换 为 3NF ， 就 要 删除 可 以 使 用 其 他 非 主键 列 得 到 的 非 主 
键 列 。 换 句 话说 ,需要 删除 描述 员工 工作 地 址 的 列 ， 我 们 删除 branchAddress 和 telNo 列 并 复制 
branchNo 列 ， 创 建 一 个 名 字 为 Branch 的 新 表 ， 此 表 中 包含 这 些 删除 的 列 ， 并 且 用 branchNo 列 
作为 此 表 的 主键 。branchAddress 和 telNo 列 在 Branch 表 中 是 候选 键 ， 因 为 这 两 个 列 可 用 于 唯一 
地 标识 一 个 给 定 的 分 公司 。 要 维护 员工 和 员工 所 工作 的 分 公司 间 的 关系 ， 因 为 StaffBranch 表 
中 的 branchNo 列 是 此 表 的 一 个 外 键 。 

修改 后 的 StaffBranch 表 和 新 的 Branch 表 的 结构 如 图 8-8 所 示 。 修 改 后 的 StaffBranch 表 是 
3NEF 的 ， 因 为 每 个 非 主键 列 都 仅 能 从 主键 stafftNo 得 到 。 

新 的 Branch 表 也 是 3NE 的 ， 因 为 每 个 非 主键 列 都 可 以 从 主键 列 branchNo 得 到 。 尽 管 这 个 表 
中 的 其 他 两 个 非 主键 列 branchAddress 和 telNo 也 可 以 用 于 得 到 给 定 分 公司 的 细节 信息 ， 但 这 并 
不 违反 3NEF， 因 为 这 些 列 是 Branch 表 的 候选 键 。 这 个 例子 说 明 ，3NE 的 定义 可 以 推广 到 表 中 的 
列 全 部 是 候选 键 的 情况 。 

因此 、 对 于 包含 多 个 候选 键 的 表 ， 你 可 以 使 用 3NEF 的 推广 定义 ， 即 如 果 这 个 表 已 经 是 1NF 
和 2NE 的 ， 并 且 所 有 的 非 主键 列 都 只 可 以 从 候选 键 的 列 得 到 。 而 且 ， 这 个 推广 对 2NF 的 定义 也 
适用 ， 即 如 果 一 个 表 是 1NE 的 ， 并 且 每 个 非 主键 列 的 值 只 能 由 所 有 的 候选 键 得 到 ， 则 它 也 是 
2NF 的 。 注意 ， 这 个 推广 不 能 改变 1NF 的 定义 ， 因 为 这 个 范式 与 键 和 表 中 列 间 的 特定 关系 无 关 。 

通过 检查 非 主键 列 和 构成 主键 的 列 间 的 关系 来 进行 规范 化 (这 可 以 鉴别 大 多 数 的 问题 并 发 现 
表 中 的 元 余 ),. 还 是 使 用 推广 的 定义 来 增加 识别 遗漏 的 元 余 的 可 能 ， 使 用 哪个 会 更 好 些 ? 事实 上 ， 
不 管 你 使 用 基于 主键 的 2NF 和 3NF 的 基本 的 定义 还 是 使 用 推广 的 定义 ， 表 的 分 解 是 一 样 的 。 

在 第 三 范式 之 后 还 有 其 他 的 范式 ， 例 如 Boyce-Codd 范 式 (BCNF)、 第 四 范式 (4NF) 和 
第 五 范式 (5NF)。 但 是 ， 这 些 范 式 并 不 常用 ， 因 为 它们 试图 定义 和 解决 在 表 中 不 经 常 出 现 的 
问题 。 如 果 你 想 更 多 地 了 解 BCNF，4NF 和 5NF， 可 以 参考 Connolly 和 Begg 写 的 《Database 
Systems》(2002 ) 。 
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staffBranch (不 是 3NF) 

8 Jefferson Way Portiand, OR 97201 | $03-555-3618 
8 Jefferson Way, Portland, OR 97201 | 503-555-3618 
City Center Plaza, Seattle, WA 98122 | 206-555-6756 
City Center Plaza, Seattle, WA 98122 | 206-555-6756 
16 ~ 14th Avenue, Seattle, WA 98128 | 206-555-3131 
14 ~ Sth Avenuel New York, NY 10012 | 212-371-3000 











将 branchAddress 列 
新 表 成 为 主键 | 将 teINo 列 移 到 新 表 


复制 branchNo 列 到 


Branch (3NF) 






503-555-3618 
206-555-6756 
212-371-3000 
206-555-3131 







8 Jefferson Way, Portland, OR 97201 
City Center Plaza, Seattle, WA 98122 
14 ~ 8th Avenue, New York, NY 10012 
16 ~ 14th Avenue, Seattie, WA 98128 









主键 成 为 外 键 
图 8-8 由 于 删除 了 name 列 ， 使 Branch 表 是 3NE 的 


8.6 本章 小 结 


“ 规范 化 是 指 创建 的 一 些 具 有 预期 实用 性 的 表 的 一 项 技术 ， 这 些 表 能 支持 用 户 或 公司 的 要 求 。 
“含有 宛 余 数据 的 表 可 能 会 导致 的 问题 叫 更 新 异常 ， 这 可 分 为 插入 异常 、 删 除 异 常 和 更 改 异 常 。 
“第 一 范式 “(1NF) 的 定义 是 一 个 表 中 的 每 一 个 列 和 记录 有 且 仅 有 一 个 值 。 

“第 二 范式 (2NF) 的 定义 是 一 个 属于 第 一 范式 的 表 ， 它 的 每 一 个 非 主键 列 必须 完全 由 全 
部 的 主键 列 决 定 。 

“第 三 范式 (3NF) 的 定义 是 一 个 即 属于 第 一 范式 又 属于 第 二 范式 的 表 ， 它 的 所 有 非 主键 
列 的 值 都 只 能 从 列 值得 到 ， 而 不 能 从 其 他 列 得 到 。 


复习 题 


8.1 讨论 在 数据 库 设 计 中 如 何 使 用 规范 化 。 
8.2 描述 在 有 宛 余数 据 的 表 上 可 能 出 现 的 更 新 异常 的 种 类 。 
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8.3 描述 违反 第 一 范式 (INF) 的 表 的 特点 ， 并 描述 如 何 将 这 样 的 表 转换 为 INF。 

8.4 表 必 须 满足 的 最 小 范式 是 什么 ? 给 出 这 个 范式 的 定义 。 

8.5 描述 一 个 将 第 一 范式 (1NF) 的 表 转 换 为 第 二 范式 (2NF) 表 的 方法 。 

8.6 描述 符合 第 二 范式 (2NF) 的 表 的 特点 。 

8.7 描述 完全 函数 依赖 的 含义 ， 并 描述 这 种 类 型 的 依赖 与 2NF 的 关系 ， 给 出 一 个 能 够 说 
明 你 的 答案 的 例子 。 

8.8 描述 符合 第 三 范式 . (3NF) 的 表 的 特点 。 

8.9 描述 传递 依赖 的 含义 ， 描 述 这 种 类 型 的 依赖 与 3NF 的 关系 ， 给 出 一 个 能 够 说 明 你 的 
答案 的 例子 。 


练习 


8.10 图 8-9 所 示 的 表 列 出 了 牙科 医生 /病人 的 预约 数据 。 一 个 病人 在 指定 的 日 期 和 时 间 预 
约 一 个 特定 治疗 室 的 牙科 医生 。 
(a) 图 8-9 所 示 的 表 存 在 更 新 异常 ， 给 出 插入 、 删 除 和 修改 异常 的 例子 。 
(b) 描述 并 说 明 对 图 8-9 所 示 的 表 进 行规 范 化 ， 使 之 符合 3NE 的 过 程 。 说 明 你 对 表 中 
所 示 数 据 所 作 的 假设 。 


Tony Smith 12-Aug-03 10.00 
Tony Smith Jill Bell 13-Aug-03 12.00 


Helen Pearson lan MacKay 12-Sept-03 10.00 
Helen Pearson jan MacKay 14-Sept-03 10.00 
Robin Plevin Jill Bell 14-Oct-03 16.30 
Robin Plevin John Walker 15-Oct-03 18.00 





图 8-9 牙科 医生 的 预约 登记 表 
8.11 一 个 名 为 InstantCover 的 代理 给 整个 Scotland 的 旅馆 提供 兼职 /临时 工 ， 图 8-10 所 示 的 
表 列 出 了 在 两 个 旅馆 工作 的 代理 员工 的 工作 时 间 。National Insurance Number ( NIN, 
国家 保险 号 码 ) 对 每 个 雇员 都 是 唯一 的 。 
(a) 图 8-10 所 示 的 表 中 存在 更 新 异常 ， 给 出 插入 、 删 除 和 修改 异常 的 例子 。 
(b) 描述 并 说 明 对 图 8:10 所 示 的 表 进 行规 范 化 ， 使 之 符合 3NF 的 过 程 。 说 明 你 对 表 
中 所 示 数 据 所作 的 假设 。 


John Smith 


234111XA | C Diane Hocine Edinburgh 
712670YD | C Sarah White Gjlasgow 
113567WD| C John Smith Glasgow 





图 8-10 InstantCover 的 员 工 及 其 工作 的 旅馆 
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第 10 章 逻辑 数据 库 设计 一 一 步 又 2 
第 11 章 高 级 建 模 技术 


第 9 章 逻辑 数据 库 设计 一 步骤 1 


本 章 主题 : 

。 什 么 是 设计 方法 学 。 

本 数据 库 设计 的 两 个 主要 阶段 : 逻辑 设计 和 物理 设计 。 

“数据 库 设计 中 的 关键 成 功 因 素 。 

“逻辑 和 物理 数据 库 设计 中 的 方法 学 。 

* 数据 库 设 计 方 法 学 中 步骤 1 的 任务 : 构建 ER 模型 。 

* 数据库 设 计 步 又 1 产生 的 文档 , .包括 ER 图 和 数据 字典 。 

在 第 4 章 中 , 我 们 描述 了 数据 库 系统 开发 生命 周期 的 主要 阶段 ,其 中 之 二 就 是 数据 库 设 计 。 
正如 我 们 在 第 6 章 介绍 的 那样 ， 只 有 在 完全 完成 了 需求 分 析 之 后 ， 本 可 以 开始 数据 库 设计 阶段 
的 工作 。 数 据 库 设 计 由 两 个 主要 阶段 组 成 : 逻辑 数据 库 设 计 和 物理 数据 库 设计 。 在 本 章 和 第 
10 章 中 ， 我 们 将 介绍 逻辑 数据 库 设计 方法 学 ， 在 第 12 章 ~ 第 16 章 中 介绍 物理 数据 库 设 计 方 法 
学 。 我 们 从 数据 库 设 计 方 法 学 的 概要 开始 介绍 ， 然后 详细 描述 与 逻辑 数据 库 设 计 步 又 1 有 关 的 
任务 。 


9.1 数据 库 设 计 方法 学 简介 


如 果 所 需要 的 数据 库 变 得 相当 复杂 ， 就 需要 有 一 种 系统 化 的 方法 去 设计 和 构建 数据 库 ， 
使 数据 库 既 满足 用 户 需 求 又 能 获得 性 能 需求 (例如 响应 时 间 )。 这 种 系统 化 方法 就 是 数据 库 设 
计 方 法 学 。 在 概要 介绍 方法 学 之 前 ， 首 先 讨论 什么 是 数据 库 设计 方法 学 ， 然后 说 明 数 据 库 设 
计 中 的 关键 成 功 因素 。 


9.1.1 什么 是 数据 库 设计 方法 学 





设计 方法 学 (Design Methodology) ”一 种 使 用 过 程 、 技 巧 、 工 具 和 文档 来 支持 和 简化 
设计 过 程 的 结构 化 方法 。 

数据 库 设计 方法 学 由 一 系列 步 又 组 成 ， 这 些 步骤 在 工程 的 每 个 阶段 引导 设计 者 使 用 合适 
的 技术 ， 这 些 阶段 还 帮助 设计 者 规划 、 管 理 、 控 制 和 评价 数据 库 开 发 过 程 。 此 外 ， 这 个 方法 
是 一 个 结构 化 的 方法 ;用 于 以 标准 化 的 和 有 组 织 的 方式 分 析 和 建立 数据 库 需求 模型 ， 
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9.1.2 数据 库 设 计 的 各 阶段 


在 本 书 中 ， 我 们 提出 了 一 种 方法 ， 这 种 方法 将 数据 库 设计 分 成 两 个 主要 的 阶段 : 逻辑 数 
据 库 设计 和 物理 数据 库 设计 。 | ' 


逻辑 数据 库 设 计 (Logical Database Design) 按照 特定 的 数据 模型 ， 构 建 企业 所 使 用 的 


数据 的 模型 的 过 程 ， 但 独立 于 特定 的 DBMS 和 其 他 的 物理 考虑 事项 。 


在 逻辑 数据 库 设 计 阶段 ， 我 们 构建 数据 库 的 逻辑 表示 ， 其 中 包括 标识 重要 的 实体 和 关系 ， 
然后 将 这 些 表 示 转 换 成 表 的 集合 。 逻 辑 数 据 库 设 计 是 物理 数据 库 设计 的 信息 来 源 ， 为 物理 数 
据 库 设计 人 员 设 计 有 效 数据 库 提供 非常 重要 的 信息 。 


物理 数据 库 设 计 (Physical Database Design) ”在 二 级 存储 上 的 数据 库 的 实现 的 描述 ， 它 





描述 基本 表 、 文 件 组 织 、 用 户 高 将 访问 数据 的 索引 和 相关 的 完整 性 约束 及 安全 性 限制 。 
在 物理 数据 库 设计 阶段 ， 我 们 确定 如 何在 目标 关系 DBMS 中 物理 地 实现 逻辑 设计 。 这 个 





阶段 允许 设计 者 决定 如 何 实现 数据 库 ， 因 此 ， 物 理 设计 与 特定 的 DBMS 有 关 。 


强调 一 下 ， 在 逻辑 数据 库 设 计 之 前 有 一 个 阶段 叫做 概念 数据 库 设计 ， 这 个 阶段 从 创建 
企业 使 用 的 数据 的 概念 数据 模型 开始 ， 它 完全 独立 于 所 有 的 实现 细节 ， 比 如 使 用 的 数据 模 
型 (例如 ， 关 系数 据 模 型 ) 和 其 他 的 物理 考虑 。 但 是 ， 我 们 是 在 设计 关系 数据 库 ， 因 此 ， 
我 们 将 概念 数据 库 设 计 和 还 辑 设计 阶段 结合 ， 并 使 用 更 通用 的 术语 -逻辑 数据 库 设 计 。 















9.1.3 数据库 设计 中 的 关键 成 功 因素 


下 述 方针 对 于 成 功 进 行 数据 库 设计 是 很 重要 的 : 
*。 尽 可 能 多 地 与 用 户 进行 交流 。 

* 在 整个 数据 建 模 过 程 中 使 用 一 种 结构 化 方法 学 。 
。 使 用 数据 驱动 方法 。 

* 在 数据 模型 中 加 入 结构 化 和 完整 性 考虑 。 

。 将 规范 化 和 事务 有 效 性 技术 结合 进 方法 学 中 。 
，。 尽 可 能 多 地 使 用 图 去 表示 数据 模型 。 

。 使 用 数据 库 设 计 语言 (DBDL )。 

。 构建 数据 字典 补充 数据 模型 图 。 

。 乐 于 重复 以 上 步骤 。 

所 有 这 些 方针 都 被 融入 方法 学 中 ， 并 在 接 下 来 的 章节 中 详细 描述 。 


9.2 数据 库 设 计 方法 学 概述 


本 节 我 们 将 给 出 数据 库 设计 方法 学 的 概述 。 方 法 学 中 的 步 又 如 图 9-1 所 示 ， 哪 个 步骤 在 哪 
章 讨论 被 列 在 了 相 毗 的 列 中 。 

遥 辑 数据 库 设计 主要 分 为 以 下 两 个 主要 步骤 : 

" 在 步骤 1 中 ， 我 们 创建 一 个 ER 模型 并 检查 这 个 模型 是 否 有 最 小 的 宛 余 ， 是 否 可 以 支持 用 


# 
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户 事务 。 这 个 步骤 的 输出 是 创建 一 个 ER 模型 ， 这 个 模型 完全 并 准确 地 表达 企业 (或 企 
业 的 一 部 分 ) 对 数据 的 需求 。 

。 在 步骤 2 中 我 们 将 ER 模型 映射 为 表 的 集合 。 对 每 个 表 的 结构 都 使 用 规范 化 来 检查 。 规 范 
化 能 够 确保 表 在 结构 上 是 一 致 的 、 逻 辑 的 ， 并 且 有 最 小 的 元 余 。 对 表 也 进行 检查 以 确保 
它们 能 支持 所 需 的 事务 ， 同 时 也 定义 数据 库 要 求 的 完整 性 约束 。 


对 有 很 多 不 同 用 户 视图 的 数据 库 系统 来 说 ， 可 能 需要 创建 一 个 或 多 个 逻辑 数据 
模型 设计 ， 并 在 数据 库 设 计 过 程 的 以 后 阶段 对 这 些 模型 进行 合并 。 我 们 将 在 附录 C 中 
描述 与 合并 数据 模型 有 关 的 典型 任务 。 


物理 数据 库 设 计 包括 六 个 主要 步骤 ; 

“ 步 又 3 包括 使 用 目标 DBMS 的 功能 设计 基本 表 和 完整 性 约束 。 

* 步骤 4 包括 为 基本 表 选 择 文件 组 织 方式 以 及 索引 。 通 常 ，DBMS 提 供 一 定数 量 的 可 供 选 择 
的 关于 数据 的 文件 组 织 方式 ， 这 不 包括 PC DBMS， 这 些 DBMS 一 般 有 固定 的 存储 结构 。 

* 步骤 5 包括 在 数据 库 系统 开发 生命 周期 的 需求 分 析 和 收集 阶段 确定 的 用 户 视图 的 设计 。 

“步骤 6 包括 设计 安全 性 措施 以 避免 末 授 权 用 户 对 数据 的 访问 。 

“ 步 怠 7 考虑 放宽 加 在 表 上 的 规范 化 约束 ， 从 而 改善 整个 系统 的 性 能 。 这 个 步 又 只 在 需要 
时 才 做 ， 因 为 在 引入 元 余 时 会 同时 产生 一 些 问题 ， 仍 需要 维护 其 一 致 性 。- 

* 步骤 8 不 断 地 通过 监视 和 调整 操作 系统 来 标识 和 解决 由 设计 引起 的 性 能 问题 ， 并 实现 新 
的 或 者 改变 的 需求 。 






逻辑 数据 库 设 计 
步骤 1: 创建 并 检查 ER 模型 
步骤 1.1: 标识 实体 
步骤 1.2: 标识 关系 
步骤 1.3: 标识 实体 或 关系 的 有 关 属 性 
步骤 1.4: 确定 属性 域 
步骤 1.5: 确定 候选 键 、 主 键 和 备用 键 属性 
步骤 1.6: 特 化 / 泛 化 实体 (可 选 步骤 ) 
步骤 1.7: 检查 模型 的 数据 元 余 
步 又 1.8: 检查 模型 是 否 支持 用 户 事 务 
步骤 1.9: 与 用 户 一 起 检查 模型 
步骤 2: 将 ER 模型 映射 为 表 
步骤 2.1: 创建 表 
步骤 2.2: 用 规范 化 方法 检查 表 结 构 
步骤 2.3: 检查 表 是 否 支持 用 户 事务 
步骤 2.4: 检查 业务 规则 
步骤 2.5: 与 用 户 讨论 逻辑 数据 库 设 计 
物理 数据 库 设 计 
步骤 3: 为 目标 DBMS 转 换 全 局 逻辑 数据 模型 
步骤 3.1: 设计 基本 表 
步骤 3.2: 设计 派生 数据 的 表示 
步骤 3.3: 设计 其 他 业务 规则 





图 9-1 逻辑 和 物理 数据 库 设 计 方法 学 中 的 各 阶段 
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步骤 4: 选择 文件 组 织 方 式 和 索引 
步骤 4.1: 分 析 事 务 
步骤 4.2: 选择 文件 组 织 方式 
步骤 4.3: 选择 索引 


步 又 5: 设计 用 户 视图 
步骤 6: 设计 安全 性 机 制 
步骤 7: 引入 受 控 元 余 的 考虑 
步骤 8: 监视 并 调整 操作 系统 





图 9-1 ( 续 ) 


附录 B 给 出 了 这 些 方法 学 的 总 结 ， 这 有 助 于 那些 已 经 熟悉 数据 库 设计 并 只 需要 了 解 主要 步 
晴 的 用 户 。 

在 整个 方法 学 中 ， 用 户 在 评审 和 检查 数据 模型 以 及 支持 文档 时 起 着 非常 关键 的 作用 。 有 
些 步 骤 可 能 与 你 所 分 析 的 企业 的 复杂 性 以 及 性 能 和 安全 性 的 要 求 无 关 。 

握 示 数据库 设计 是 一 个 远 代 过 程 ， 开 始 以 后 就 要 不 断 进行 精 化 。 尽 管 我 们 介绍 的 数据 库 

设计 方法 学 是 一 个 过 程 化 的 过 程 ， 但 这 并 不 意味 着 要 以 过 程 化 的 方式 执行 。 你 在 某 一 个 阶 

段 得 到 的 结果 可 能 会 改变 你 在 上 一 个 阶段 作出 的 决定 。 同 样 ， 你 会 发 现在 后 一 个 阶段 中 查 

看 一 下 前 面 的 结果 也 是 有 所 帮助 的 。 这 种 方法 可 以 作为 框架 指导 你 高 效 地 进行 数据 库 设 计 。 


9.3 逻辑 数据 库 设计 方法 学 步骤 1 简介 


本 节 概 述 逻 辑 数据 库 设计 方法 学 的 第 一 个 步骤 一 一 为 在 分 析 阶段 标识 的 用 户 视图 建立 一 个 
ER 模型 。 










在 分 析 阶 段 ， 你 已 经 标识 了 若干 用 户 视图 ， 视图 的 多 少 依 环 于 这 些 视图 的 交合 
数量 和 数据 库 系统 的 复杂 度 ， 你 可 能 已 经 对 有 些 用 户 视图 进行 了 合并 。 在 6.4.4 节 讨 
论 的 需求 收集 和 分 析 阶 段 ， 我 们 使 用 集中 式 方法 为 StayHome 创 建 了 两 个 用 户 视图 的 
集合 ， 它 们 表达 了 下 述 用 户 视图 的 合并 需求 : 
。Branch 用 户 视图 表示 Manager (经 理 )、Supervisor (监理 ) 和 Assistant (助理 ) 
用 户 视图 。 
。Business 用 户 视图 表示 Director (导演 ) 和 Buyer (购买 者 ) 用 户 视图 。 
在 后 面 的 内 容 中 ， 我 们 将 为 StayHome 的 Branch 用 户 视图 构建 一 个 逻辑 数据 模型 。 在 第 4 章 中 ， 
我 们 引 人 和 人 了 术语 “局 部 逻辑 数据 模型 ”来 描述 表达 一 个 或 多 个 (但 不 是 数据 库 中 全 部 ) 用 户 视图 
的 模型 ， 但 本 章 描述 的 是 数据 库 设 计 方法 学 ， 所 以 我 们 只 使 用 更 通用 的 术语 “逻辑 数据 模型 *。 
如 果 你 有 兴趣 构造 更 复杂 的 数据 库 ， 那么 首先 需要 创建 独立 的 局 部 逻辑 数据 模型 来 代表 
数据 库 中 的 不 同 的 用 户 视图 ， 我 们 在 附录 C 中 描述 并 演示 了 使 用 Branch 和 Business 用 户 视图 合 
并 StayHome 的 数据 模型 的 方法 。 


9.4 步骤 1: 创建 并 检查 ER 模型 











目标 构建 将 由 数据 库 支持 的 企业 (或 企业 的 一 部 分 ) 的 数据 需 





求 的 ER 模型 。 
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每 个 ER 模型 组 成 如 下 : 

。 属 性 和 属性 域 。 

。 主 键 和 备用 键 。 

ER 模型 是 由 文档 支持 的 ， 包 括 数据 字典 和 ER 图 ,它们 是 在 模型 的 开发 过 程 中 产生 的 。 我 
们 将 详细 介绍 在 每 个 步 又 中 所 产生 的 支持 文档 的 类 型 。 步 又 1 包括 的 主要 任务 有 : 

“步骤 1.1: 标识 实体 。 

。 步 最 1.2: 标识 关系 。 

“步骤 1.3: 标识 实体 或 关系 的 有 关 属 性 。 

。 步 又 1.4: 确定 属性 域 。 

* 步骤 1.5: 确定 候选 刍 、 主 键 和 备用 键 属性 。 

* 步骤 1.6: 特 化 /证 化 实体 (可 选 步骤 )。 

“步骤 1.7: 检查 模型 的 数据 元 余 。 

* 步 难 1.8: 检查 模型 是 否 支持 用 户 事 务 。 

。 步骤 1.9: 与 用 户 一 起 检查 模型 。 

现在 ， 让 我 们 开始 为 StayHome 的 Branch 用 户 视图 构建 ER 模型 。 


9.4.1 步骤 1.1: 标识 实体 


目标 标识 需要 的 实体 。 | 


构建 ER 数据 模型 的 第 一 步 就 是 定义 用 户 感 兴趣 的 主要 对 象 。 这 些 对 象 就 是 模型 中 的 实体 。 
标识 实体 的 一 种 方法 就 是 仔细 研究 用 户 的 需求 说 明 。 从 说 明 中 ， 可 以 定义 提 到 的 名 词 或 名 词 
短语 (例如 ，staff number ( 员工 号 )、staff name (员工 名 )、catalog number (目录 号 )、title 
(标题 )、daily rental rate (日 租金 )、purchase price (购买 价格 ))， 还 应 该 查找 主要 对 象 ， 如 
people (人 物 )、place (地 点 ) 或 concepts of interest (利润 )， 排除 那些 只 表示 其 他 对 象 特征 
的 名 词 。 

例如 ， 可 以 把 staff number 和 staff name 组 成 实体 Staff。catalog number、title、 daily rental 
rate 和 purchase price 组 成 实体 Video (录像 )。 

标识 实体 的 另 一 种 方法 是 查找 那些 有 存在 必要 的 对 象 。 例如 ，Staff ( 员工) 是 一 个 实体 ， 
因为 无 论 是 否 知 道 他 们 的 名 字 、 地 址 和 工资 ， 员工 都 是 存在 的 。 如 果 可 能 ， 应 该 依靠 用 户 辅 
助 完成 这 项 活动 。 

有 了 时 由 于 实体 在 用 户 需求 说 明 中 提出 的 方式 不 同 ， 因此 标识 实体 是 很 困难 的 。 用 户 通常 
习惯 于 用 “例子 ”或 “类 推 ”来 谈论 。 用 户 可 能 用 人 员 的 名 字 (people's names ) ， 而 不 是 通 
常 所 说 的 staff (员工 )。 在 某 些 例子 中 ， 尤其 是 在 既 有 公司 又 有 人 员 的 例子 中 ， 用 户 使 用 工作 
角色 术语 。 这 些 角色 可 能 是 工作 名 称 或 职责 ， 如 Manager (经 理 )、Deputy Manager 〈 副 经 理 )、 
Supervisor (监理 ) 或 Assistant (助理 )。 更 麻烦 的 是 ， 用 户 经 常 使 用 同义词 和 多 义 词 。 
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当 两 个 词 意 义 相同 时 是 同义词 。 例 如 ，branch 和 outlet。 由 于 上 下 文 关系 ,一 个 词 


有 不 同 的 意义 就 是 多 义 词 。 例 如 词 program 有 几 个 不 同 的 意义 ， 如 一 系列 事件 、 工 作 计 

划 、 软 件 程 序 和 研究 课程 。 

某 一 个 对 象 是 否 是 实体 、 关 系 或 属性 ， 并 不 总 是 很 明显 的 。 例 如 ， 对 “婚姻 ”怎样 建 
模 ? 实际 上 ， 对 于 不 同 的 实际 需求 ， 可 以 把 “婚姻 ”作为 实体 、 关 系 或 属性 中 的 任意 一 个 或 
者 全 部 。 你 会 发 现 分 析 是 主观 的 ， 不 同 的 设计 者 可 能 会 产生 不 同 的 解释 ， 但 这 些 解 释 却 是 等 
效 的 。 在 某 种 程度 上 来 说 ， 这 种 工作 依靠 的 是 判断 力 和 经 验 。 数 据 库 设计 者 必须 根据 现实 世 
界 进行 选择 ， 并 根据 实际 情况 对 事务 进行 分 类 。 因 此 ， 从 用 户 提供 的 需求 说 明 得 到 的 一 组 实 
体 可 能 不 是 唯一 的 。 然 而 ， 分 析 过 程 的 不 断 重复 必定 会 引导 你 选择 对 完成 系统 需求 来 说 已 经 
足够 用 的 实体 。 


提示 数据 库 设 计 的 主观 性 开始 可 能 令 人 烦恼 。 但 是 ， 根 据 本 书 提供 的 方法 学 ， 你 会 发 
现 设 计 是 可 以 完成 的 ， 并 且 在 有 了 一 些 练习 和 经 验 后 ， 设 计 变 得 容易 多 了 。 为 了 进 一 
步 学 习 ， 在 第 17 章 和 第 18 章 中 ， 我 们 将 完成 另 一 个 例子 的 学 习 。 在 附录 E 中 我 们 提供 了 
你 可 能 会 遇 到 的 许多 常见 的 业务 数据 模型 。 





1. StayHome 实 体 

对 于 StayHome 的 Branch 用 户 视 图 ， 可 以 定义 下 列 实体 : 
Branch( 分 公司 ) Staff (员工 ) 

Video (录像 ) VideoForRent ( 出租 录 像 ) 
Member (成 员 ) RentalAgreement (出 租 协议 ) 
Actor( 演 员 ) Director ( 导演 ) 

2. 实体 文档 


当 标识 实体 时 ,应 使 实体 的 名 字 对 用 户 来 说 意义 直观 。 在 数据 字典 中 记录 实体 的 名 字 和 
描述 。 如 果 有 可 能 ， 记 录 希 望 每 个 实体 出 现 的 序号 。 如 果 一 个 实体 有 不 同 的 名 字 ， 这 些 名 字 
被 认为 是 同义词 或 别名 ， 而 这 些 也 应 记录 在 数据 字典 中 。 图 9-2 说 明了 从 StayHome 实 体 的 
Branch 用 户 视图 的 文档 的 数据 字典 中 抽取 出 的 内 容 。 





图 9-2 从 数据 字典 中 抽取 出 来 的 StayHome 实 体 的 描述 
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9.4.2 步骤 1.2: 标识 关系 


| 目标 标识 实体 间 存 在 的 重要 关系 。 | 


标识 完 实 体 之 后 ， 下 一 步 就 是 标识 这 些 实体 间 的 所 有 关系 。 标 识 实体 时 ， 一 种 方法 是 在 
用 户 的 需求 说 明 中 寻找 名 词 。 标 识 关系 时 ， 也 可 以 利用 需求 说 明 的 语法 。 一 般 地 ， 关 系 由 动 
词 或 动词 短语 表示 。 例 如 : 
。Branch Has Staff (分 公司 有 员工 )。 
“Branch 1sAllocated VideoForRent (分 公司 被 分 派 了 出 租 录像 )。 
* VideoForRent IsPartOf RentalAgreement ( 出 租 录 像 是 出 租 协议 的 一 部 分 )。 : 
事实 上 ， 用 户 的 需求 说 明 中 记录 了 这 些 关 系 ， 说 明 它 们 对 用 户 很 重要 ， 因 此 在 模型 中 必 
提示 ”我们 只 对 实体 间 必 需 的 关系 感 兴趣 。 在 前 面 的 例子 中 ， 标 识 了 Branch IsAllocated 
VideoForRent 和 VideoForRent IsPartOf RentalAgreement 关 系 。 我 们 也 可 以 认为 在 Branch 
和 RentalAgreement ( 出 租 协 议 ) 之 间 和 包含 一 个 关系 (例如 ，Branch Handles 
RentalAgreement ( 分 公司 处 理 出 租 协议 ) )。 尽管 这 是 一 个 可 能 的 关系 ， 但 根据 需求 ， 
它 并 不 是 我 们 在 模型 中 感 兴趣 的 关系 。 我 们 将 要 在 步骤 1.7 中 进一步 讨论 。 


要 确保 在 用 户 需求 说 明 中 的 显 式 或 隐 式 的 关系 均 被 标识 出 来 ， 原则 上 说 ， 检 查 每 一 对 具 
有 溢 在 关系 的 实体 应 该 是 可 能 的 ， 但 对 包含 成 百 个 实体 的 大 系统 来 说 这 是 一 项 令 人 望 而 牛 情 
的 任务 。 另 一 方面 ， 不 进行 这 样 的 检查 也 是 不 明智 的 。 不 过 ， 当 检 查 模型 是 否 支持 用 户 需 要 
的 事务 时 ， 是 否 丢失 了 关系 会 很 明显 地 显示 出 来 。 

在 大 多 数 情况 下 ， 关 系 都 是 二 元 的 ， 换 句 话说 ， 关系 只 存在 于 两 个 实体 之 间 。 但 是 ， 你 
应 该 注意 那些 多 于 两 个 实体 间 的 复杂 关系 和 那些 只 涉及 一 个 实体 的 递归 关系 。 就 StayHome 的 
Branch 用 户 视图 而 言 ， 应 该 标识 如 下 的 非 二 元 关系 : 

Registers (登记 ) Branch.、 Member 和 Staff 之 间 的 三 元 关系 。 

Supervises (监督 ) 基于 Staff 的 递归 关系 。 

1. StayHome 的 关系 : 

对 于 StayHome 的 Branch 用 户 视图 而 言 ， 可 以 标识 图 9-3 中 所 示 的 关系 。 


Branch Has Staff 
























IsAllocated VideoForRent 
Branch, Staff” Registers Member 
Staff Manages Branch 
Supervises Staff 
Video Is | VideoForRent 
VideoForRent IsPartOf RentalAgreement 
Member Requests RentalAgreement 
Actor PlaysIn Video 
Director . Directs Video 







注 : * 表 示 一 个 三 元 关系 。 
图 9-3 StayHome 中 Branch 用 户 视图 的 关系 的 初稿 
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(1) 使 用 实体 - 关系 概念 《ER ) 建 模 
直观 地 显现 一 个 复杂 系统 ， 要 比 把 该 系统 解释 成 很 长 的 文字 描述 容易 得 多 。 实 体 - 关 系 图 (ER 
图 ) 可 用 于 更 好 地 描述 实体 和 它们 之 间 的 关系 。 图 94 所 示 的 ER 模型 是 描述 上 述 实体 和 关系 的 初稿 。 





图 9-4 StayHome 中 Branch 用 户 视图 中 实体 和 关系 的 ER 模型 初稿 





提示 ”在 整个 数据 库 设 计 过 程 中 ， 我 们 建议 在 任何 需要 的 时 候 都 使 用 ER 建 模 ， 这 样 可 
以 帮助 构建 起 要 的 模型 的 图 形 描述 。 不 同 的 人 可 以 使 用 不 同 的 ER 模型 符号 。 本 书 中 ， 
我 们 使 用 最 先进 的 面向 对 象 标 记 法 一 一 UML(Unified Modeling Language， 统 一 建 模 语 
言 )， 但 其 他 标记 法 也 实现 相似 的 功能 。 


(2) 确定 关系 的 多 样 性 约束 
标识 完 要 建 模 的 关系 后 ， 接 下 来 要 确定 关系 的 种 类 。 如 果 知 道 了 多 样 性 的 特定 值 ， 或 者 
甚至 知道 了 上 限 和 下 限 限 制 ， 则 应 把 这 些 值 也 记录 在 文档 中 。 


Branch Staff 
VideoForRent 
Member 
Branch 

Staff 
VideoForRent 


RentalAgreement 


IsAllocated 
Branch, Staff“ Registers 


Staff 


me 
一 


Manages 
Supervises 
Is 
IsPartOf 
Requests 


Video 
VideoForRent 
Member RentalAgreement 
Video 


Video 


Actor PlaysIn 


~ OO- 一 ~ O-OoO-- 


来 
.本 
本 
-1 
水 
来 
ek 
EE 


1. 
1. 
1. 
0. 
0. 
1. 
0. 
0. 
1. 
1. 


Director Directs 





注 : * 表示 一 个 三 元 关系 。 
图 9-5 StayHome 中 关系 的 多 样 性 约束 
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一 个 包括 多 样 性 约束 的 模型 更 明确 地 描述 了 关系 的 语义 ， 可 以 在 模型 中 产生 更 好 的 表达 
结果 。 多 样 性 约束 被 用 来 检查 和 维护 数据 特征 。 当 数据 库 更 新 时 ， 要 判断 是 否 违 反 了 规则 ， 
这 些 约束 就 会 起 作用 了 。 

2. StayHome 的 多 样 性 约束 

对 于 StayHome 示 例 ， 应 该 标识 图 9-5 中 所 示 的 多 样 性 约束 。 图 9-6 显 示 了 用 这 些 新 添加 的 
信息 更 改 后 的 ER 模型 。 

(1) 检查 扇形 陷阱 和 深 坑 陷阱 

标识 了 关系 后 ， 应 该 检查 每 个 关系 所 描述 的 是 不 是 确实 是 所 需要 的 ， 并 且 应 该 检查 是 否 
在 不 经 意 间 产生 了 陷阱 ( 遍 形 陷阱 和 深 坑 陷 阱 参见 7.7 节 )。 

(2) 将 关系 存档 

在 标识 关系 时 ， 为 关系 指定 一 个 有 意义 并 且 对 用 户 来 说 直观 的 名 字 。 在 数据 字典 中 ， 要 
记录 关系 的 描述 以 及 关系 的 多 样 性 约束 。 图 9-7 显 示 了 从 StayHome 的 Business 用 户 视图 的 数据 
字典 中 选 出 的 有 关 关 系 的 文档 。 












二 Supervises 






“» 到 
Ls Bh NT - ue Be 


hs 
:| 






图 9-7 从 StayHome 的 Branch 用 户 视图 的 数据 字典 中 抽取 的 关系 的 描述 








730 梨 三 部分 避 才 数据 亩 三 矿 


9.4.3 步骤 1.3: 标识 实体 或 关系 的 有 关 属 性 








目标 为 实体 和 关系 标识 相关 属性 。 


方法 学 中 的 下 一 步骤 就 是 为 已 经 确定 的 数据 库 中 的 实体 和 关系 标识 属性 类 型 。 与 标识 实 
体 很 相似 ， 首 先 要 在 用 户 需求 说 明 中 寻找 名 词 或 名 词 短语 。 当 这 个 名 词 或 名 词 短 语 是 特性 、 
标志 或 前 面 定义 的 实体 或 关系 的 特征 时 就 可 被 标识 成 属性 (属性 的 详细 内 容 参 见 7.3 节 )。 

提示 。 当 我 们 在 用 户 需求 说 明 中 标识 完 实 体 或 关系 之 后 ， 最 简单 的 事情 就 是 考虑 “ 哪 

些 信 息 是 我 们 需要 保存 的 "， 在 用 户 的 需求 说 明 中 应 该 有 这 个 问题 的 答案 。 但 是 ， 有 时 

可 能 需要 询问 用 户 来 明确 需求 。 但 是 ， 他 们 所 给 的 答案 可 能 又 包含 了 其 他 概念 ， 因 此 

对 于 用 户 的 回答 必须 仔细 考虑 。 


1. 简单 /复合 属性 

标识 属性 是 简单 的 还 是 复合 的 是 很 重要 的 。 复 合 属性 由 简单 属性 组 成 。 例 如 ， 一 个 地 址 
属性 可 以 是 简单 的 ， 把 所 有 关于 地 址 的 细节 当 作 一 个 值 ， 例 如 “8 Jefferson 
Way,Portland,OR,97201”。 但 是 ， 地 址 属性 也 可 以 是 由 简单 属性 组 成 的 复合 属性 ， 把 描述 地 址 
细节 的 各 元 素 分 开 ， 如 街道 (8 Jefferson Way)、 城 市 (Portland)、 州 (OR) 和 邮编 (97201)。 
(简单 /复合 属性 定义 参见 7.3.1 节 。) 
选择 地 址 属性 是 简单 的 还 是 复合 的 ， 是 由 用 户 需求 决定 的 。 如 果 用 户 不 需要 访问 地 址 
中 各 个 独立 的 部 分 ， 就 可 以 把 地 址 属性 描述 为 简单 属性 。 另 一 方面 ， 如 果 用 户 需要 访问 地 
址 中 独立 的 各 个 部 分 ， 就 应 该 把 地 址 属性 描述 为 由 必需 的 简单 属性 所 组 成 的 复杂 属性 。 


2. 单 值 /多 值 属 性 

除了 可 将 属性 分 为 简单 和 复合 的 之 外 ， 属 性 还 可 以 是 单 值 的 或 是 多 值 的 属性 。 大 多 数 属 
性 是 单 值 的 , ,但 有 时 也 会 碰 到 多 值 属性 ， 也 就 是 说 某 一 个 实体 的 属性 有 多 个 值 。 例 如 ， 可 把 
实体 Branch (分 公司 ) 的 属性 telNo (电话 号 码 ) 标识 为 多 值 属性 。( 多 值 属性 参见 7.3.2 节 。) 


. 也 可 以 把 分 公司 电话 号 码 作为 一 个 独立 的 实体 ， 这 是 对 这 种 问题 进行 建 模 一 种 替 
换 方 法 ， 它 是 同样 有 致 的 。 正 如 将 在 步骤 2.1 中 看 到 的 ， 如 果 把 多 值 属性 映射 为 实体 ， 
两 种 方法 产生 的 最 终结 果 是 相同 的 。 

3. 派生 的 属性 

如 果 属 性 值 可 以 通过 检查 其 他 属性 的 值得 到 ， 则 此 属性 就 称 为 派生 属性 。 通 常 ， 在 逻辑 数据 
模型 中 见 不 到 这 些 属性 。 然 而 ， 有 时 该 派生 属性 值 或 派生 属性 所 依赖 的 源 属 性 值 会 被 删除 或 修改 。 
这 时 ， 为 了 避免 潜在 地 丢失 信息 ,派生 属性 在 数据 模型 中 必须 可 见 。 如 果 模 型 中 出 现 派生 属性 ， 
则 必须 在 它 的 名 字 前 加 上 前 级 “/” 来 说 明 它 是 派生 而 来 的 。( 派 生 属性 定义 参见 7.3.3 节 。) 

在 物理 数据 库 设计 期 间 ， 我 们 才 考 虑 派生 属性 的 表达 。 由 于 使 用 属性 的 方式 不 同 ， 在 每 
次 访问 派生 属性 或 当 它 所 派生 的 值 发 生变 化 时 ， 都 要 计算 派生 属性 的 值 。 这 并 不 是 逻辑 数据 
库 设 计 要 研究 的 内 容 ， 我 们 将 在 第 12 章 步骤 3.2 中 讨论 如 何 更 好 地 从 物理 上 描述 派生 属性 。 

4. 潜在 问题 

当 标 识 属性 时 ， 从 原始 的 选择 中 删除 一 一 个 或 更 多 实体 是 很 有 可 能 的， 这 种 情况 下 ， 应 返 
回 前 面 的 步骤 ， 将 新 的 实体 存档 并 重新 检查 相关 的 关系 。 
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提示 “生成 一 张 包含 用 户 需求 说 明 中 的 所 有 属性 的 列表 是 很 有 用 的 。 当 把 属性 与 具体 的 
实体 或 关系 关联 起 来 时 ， 就 把 该 项 属性 从 列表 中 删除 。 这 样 一 来 ， 就 可 以 保证 一 个 属 
性 只 与 一 个 实体 或 关系 相关 。 当 表 为 空 时 ， 所 有 的 属性 就 都 与 某 实体 或 关系 相关 了 。 


也 必须 注意 那些 可 能 不 只 与 一 个 实体 相关 的 属性 ， 这 表明 可 能 会 有 如 下 情况 : 

。 可 能 已 经 标识 了 几 个 可 以 合 在 一 起 的 实体 。 例 如， 可 能 标识 了 实体 Manager 和 Supervisor， 
它们 都 有 属性 StaffNo (员工 号 )、name (名 字 ) 和 salary (工资 ) ， 而 这 些 可 以 用 一 个 叫 
做 Staff (员工 ) 的 实体 来 表达 ， 此 实体 包含 staffNo、name、 salary 和 position 属 性 。 

另 一 方面 ， 有 些 实 体 可 能 包含 很 多 相同 的 属性 ， 但 其 中 的 每 个 实体 又 有 自己 各 自 不 

同 的 属性 。 在 第 11 章 中 ， 我 们 将 看 到 一 些 高 级 的 ER 建 模 概念 ， 如 特 化 和 泛 化 ， 并 提供 
了 使 用 它们 的 方法 。 这 些 高 级 概念 可 以 更 精确 地 表达 如 上 这 种 情况 。 在 这 儿 ， 我 们 省 略 
了 这 些 高 级 概念 ， 让 它们 成 为 可 选 步骤 (步骤 1.6) 从 而 使 基本 的 方法 学 尽 可 能 简单 。 

。 已 经 标识 完了 实体 间 的 关系 。 这 时 ， 必 须 把 属性 与 一 个 实体 〈 也 就 是 父 实体 ) 相 联 ， 并 
要 确保 步骤 1.2 中 标识 的 关系 。 如 果 情 况 不 是 这 样 ， 则 必须 根据 新 标识 的 关系 更 新 文档 。 
例如 ， 假 设 已 经 用 如 下 属性 标识 了 实体 Branch 和 Staff: 











Branch branchNo、 street、 city、state、ZzipCode、managerName 
(分 公司 ) (分 公司 号 、 和 街道、 城市 、 州 、 邮 编 、 经 理 名 字 ) 

Staff staffNo、 name、position、salary 

(员工 ) (员工 号 、 名 字 、 职 位 、 工 资 ) 


由 于 Branch 中 managerName 属 性 的 出 现 是 要 表达 Staff Manages Branch ( 员工 管理 分 公司 ) 关系 。 
这 种 情况 下 ， 属 性 managerName 应 该 从 实体 Branch 中 删除 ， 并 且 应 该 在 模型 中 添加 Manages 关 系 。 

5. StayHome 中 实体 的 属性 

对 于 StayHome 这 个 例子 中 的 Branch 用 户 视图 ， 应 该 对 实体 进行 标识 和 添加 有 关 的 属性 ， 
如 下 述 所 示 : 


Branch branchNo、address (复合 :street、city、state、zipCode)、telNo (多 值 ) 
(分 公司 ) (分 公司 号 、 地 址 (复合: 街道 、 城 市 、 州 、 邮 编 )、 电 话 号 码 ) 
Staff staffNo、name、position、salary 

(员工 ) (员工 号 、 名 字 、 职 位 、 工 资 ) 

Video catalogNo、 title、category、dailyRental、price 

(录像 ) (类 别 号 、 标 题 、 类 别 、 日 租 、 价 格 ) 

Director directorName 

(导演 ) (导演 姓名 ) 

Actor actorName 

(演员 ) (演员 姓名 ) 

Member memberNo、name (复合 : fName、]lName)、address 

(成 员 ) (成 员 号 、 名 字 (复合 : 姓 、 名 )、 地 址 ) 

RentalAgreement rentalNo、dateOut、dateReturn 

(出 租 协议 ) (出 租 号 、 出 租 日 期 、 归 还 日 期 ) 

VideoForRent videoNo、available 


(出 租 录像 ) - (录像 号 、 可 否 出 租 ) 
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注意 实体 Branch 中 的 address 属 性 和 实体 Member 中 的 name 属 性 是 复合 型 的 ， 而 实体 

Member 中 的 address 属 性 和 实体 Staff、Director 和 Actor 中 的 name 属 性 是 简单 型 的 。 这 就 

反映 了 这 些 属性 的 不 同 的 用 户 访问 需求 。 

6. StayHome 中 关系 的 属性 

很 难 把 属性 dateJoined (描述 会 员 在 分 公司 登记 的 日 期 ) 与 某 一 个 特定 的 实体 相 联 。 不 能 
和 实体 Member 相 联 ， 因 为 一 个 Member 能 在 不 只 一 个 分 公司 登记 。 事 实 上 ， 这 个 属性 不 能 与 
以 上 的 任何 一 个 实体 相 联 ， 但 应 该 与 实体 Member、Branch 和 Staff 之 间 的 三 元 关系 Registers 
(登记 ) 相 联 。 类 似 的 情况 下 ， 属 性 character (描述 演员 在 录像 中 的 角色 名 称 ) 应 与 实体 Actor 
和 Video 之 间 的 多 对 多 关系 PlaysIn (出 演 ) 相 联 。 

7. 将 属性 存档 

在 标识 属性 时 ， 应 该 为 他 们 取 有 意义 且 直 观 的 名 字 ， 然后 为 每 个 属性 记录 如 下 信息 : 

“" 属性 名 称 和 描述 。 

。 数据 类 型 和 长 度 。 

。 属 性 的 别名 或 同义词 。 

“属性 可 不 可 以 为 空 ( 空 定义 参见 2.3.1 节 )。 

。 属 性 是 否 为 多 值 的 。 

* 属性 是 否 是 复合 的 , "如 果 是 ， 组 成 复合 属性 的 简单 属性 是 什么 。 

* 属性 是 否 为 派生 的 ， 如 果 是 ， 应 该 怎样 计算 。 

* 属性 的 默认 值 (如 果 指 定 的 话 )。 

图 9-8 显 示 了 StayHome 的 Branch 用 户 视图 数据 字典 中 的 部 分 属性 的 文档 。 





图 9-8 显示 了 StayHome 的 Branch 用 户 视图 的 数据 字典 中 的 部 分 属性 描述 
9.4.4 步骤 1.4: 确定 属性 域 
目标 确定 ER 模型 中 的 属性 域 。 
这 步 的 目标 就 是 确定 ER 模型 中 的 属性 域 。 域 是 一 组 值 的 集合 ， 一 个 或 多 个 属性 可 以 从 中 
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选择 它们 的 值 。 例 如 StayHome 的 属性 域 包括 : 
。 合 法 的 分 公司 号 的 属性 域 是 一 个 四 位 字符 的 定 长 字符 串 ， 并 且 第 一 个 字符 必须 是 字母 ， 
后 三 个 字符 是 从 000 到 999 的 数字 。 
。 合 法 的 电话 号 码 的 属性 域 是 一 个 10 位 的 数字 串 。 
。VideoForRent 实 体 的 available 属 性 的 可 能 值 是 Y 或 N。 这 个 属性 的 域 是 包含 值 Y 和 N 的 单 
个 字符 。 
一 个 开发 完备 的 数据 模型 为 模型 中 的 每 个 属性 指定 域 ， 其 中 包括 : 
。 该 属性 的 允许 值 集合 。 
。 该 属性 大 小 和 格式 。 
将 属性 域 存档 
当 标 识 属性 域 时 ， 在 数据 字典 中 记录 它们 的 名 字 和 特征 。 更 改 属性 的 数据 字典 项 ， 用 域 
来 代替 数据 类 型 和 长 度 信息 。 


9.4.5 步骤 1.5: 确定 候选 键 、 主 键 和 备用 键 属性 


目标 为 每 个 实体 标识 候选 键 ， 如 果 有 多 个 候选 键 ， 则 选择 其 中 之 一 作为 主键 ， 并 标识 





其 他 的 备用 键 。 


这 步 就 是 要 为 实体 确定 候选 键 ， 然 后 从 中 选 出 一 个 主键 。 一 定 要 确保 候选 键 永 不 为 空 
(如 果 候 选 键 不 只 包含 一 个 属性 ， 那 么 每 个 属性 都 不 能 为 空 ) 。 如 果 标 识 了 多 个 候选 键 ， 则 必 
须 选 择 其 中 之 一 作为 主键 ， 其 他 的 候选 键 被 称 为 备用 键 。( 键 的 定义 参见 2.2.3 节 和 7.3.4 节 。) 


提示 。 正 如 我 们 在 2.2.3 节 中 指出 的 ， 人 名 通常 不 适合 作 候 选 键 。 例 如 ， 你 可 能 觉得 对 
Staff ( 员工 ) 实体 来 说 ，name (名 字 ) 是 比较 合适 的 候选 键 。 但 是 ， 可 能 有 两 个 同名 
的 人 都 加 入 了 StayHome， 这 样 就 可 看 出 ，name 不 可 作为 候选 键 。 我 们 可 以 对 StayHome 
的 成 员 的 名 字 进 行 类 似 的 讨论 。 这 时 ， 定 义 一 个 具有 唯一 性 属性 ， 要 上 比 把 不 同 的 属性 
组 合 起 来 来 提供 唯一 性 要 好 得 多 。 例 如 ，Staff 实 体 的 staffNo 属 性 和 Member 实 体 的 
memberNo 属 性 ， 就 是 这 样 的 新 属性 。 


当 从 候选 键 中 选择 主键 时 ， 应 遵循 如 下 指南 来 进行 选择 : 

“具有 最 少 的 一 组 属性 的 候选 键 。 

* 值 很 少 变化 的 候选 键 。 

* 在 未 来 不 会 失去 唯一 性 的 候选 键 。 

* 字符 最 少 的 候选 键 (对 文本 属性 来 说 )。 

* 最 大 值 最 小 的 候选 键 (对 数值 型 属性 来 说 )。 

“从 用 户 的 观点 来 看 最 易于 使 用 的 候选 键 。 

在 标识 主键 的 过 程 中 ， 要 注意 实体 是 强 实体 还 是 弱 实 体 。 如 果 可 以 为 一 个 实体 赋予 一 个 
主键 ， 则 这 个 实体 将 被 看 成 是 强 实 体 。 反 之 ， 如 果 不 能 为 一 个 实体 标识 主键 ， 则 这 个 实体 就 
是 弱 实 体 ( 弱 实体 定义 参见 7.4 节 )。 但 是 ， 与 弹 实体 有 关 的 一 个 或 多 个 属性 也 可 能 成 为 最 终 
的 主键 的 一 部 分 ， 但 它们 并 不 提供 唯一 性 。 


只 有 在 将 弱 实 体 映 射 为 表 时 才能 标识 弱 实 体 的 主键 ， 我 们 将 在 第 10 章 的 步骤 2.1 中 描述 。 
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1. StayHome 主键 
对 于 StayHome 的 Branch 用 户 视图 ， 应 该 像 图 9-9 所 示 的 那样 标识 主键 。 





二 Directs 


ass 










eS YD 
大 Manages Supervisor 







图 9-9 显示 主键 的 StayHome 的 Branch 用 户 视图 的 ER 模型 


从 StayHome 所 给 的 用 户 需 求 来 说 ， 对 Director (导演 ) 和 Actor (演员 ) 实体 来 说 
没有 明显 的 键 。 实 际 上 ，Director 实 体 中 唯一 用 于 标识 的 属性 就 是 导演 的 名 字 ， 而 Actor 
实体 也 是 用 演员 名 来 标识 实体 的 。 正 如 我 们 刚才 所 说 的 ， 这 些 属性 并 不 适合 作 主 键 ， 
所 以 我 们 为 这 两 个 实体 构造 主键 ， 分 别 叫 做 directorNo( 导 演 号 ) 和 actorNo (演员 号 )。 


2. 将 候选 键 、 主 键 和 备用 键 存 档 


在 数据 字典 中 记录 候选 键 、 主 键 和 备用 键 (如 果 可 获得 ) 的 定义 。 图 9-10 显 示 了 从 数据 字典 
中 选 出 的 带 有 键 的 StayHome 属 性 的 文档 。 














图 9-10 数据 字典 中 有 主键 和 备用 键 定 义 的 StayHome 属 性 








党 9 芋 逻 餐 数据 亩 说 矿 -一 艺 县 1 135 





9.4.6 步骤 1.6: 特 化 / 泛 化 实体 (可 选 步骤 ) 








| 目标 _ 如果 合适 的 话 ， 标 识 超 类 和 子 类 实体 。 | 


在 这 个 步骤 中 ， 可 以 选择 使 用 特 化 或 泛 化 过 程 来 继续 逻辑 数据 模型 的 开发 。 超 类 和 子 类 
的 建 模 为 数据 模型 添加 了 更 多 的 信息 ， 但 是 也 使 模型 更 加 复杂 。 结 果 ， 由 于 这 步 是 可 选 的 ， 
因此 我 们 现在 将 略 过 特 化 和 证 化 的 细节 ， 有 兴趣 的 读者 可 以 参见 第 11 章 。 


9.4.7 步骤 1.7: 检查 模型 的 数据 元 余 


目标 在 ER 模型 中 检查 宛 余 的 情况 。 


在 这 个 步骤 中 ， 用 指定 的 目标 检查 ER 模型 是 否 有 元 余 存 在 ， 并 删除 这 些 宛 余 。 在 这 个 步 
又 中 有 三 个 话 动 : 

1) 重新 检查 一 对 一 (1:1) 关系 。 

2) 删除 宛 余 关系 。 

3) 当 访 问 元 余 时 考虑 时 间 尺 度 。 

1. 重新 检查 一 对 一 (1:1) 关系 . 

在 标识 实体 时 ， 可 能 标识 了 两 个 实体 ， 但 它们 表示 同一 个 对 象 。 例 如 ， 标 识 了 实体 
Branch 和 Outlet， 实 际 上 它们 是 一 样 的 。 换 句 话说 ，Branch 是 Outlet 的 同义词 。 这 时 ， 这 两 个 
实体 应 该 合并 。 如 果 主 键 不 同 ， 那 么 选择 其 中 之 一 作为 主键 ， 另 一 个 作为 候选 键 。 

2. 删除 宛 余 关系 

如 果 通 过 其 他 关系 可 以 获得 相同 的 信息 ， 则 这 个 关系 就 是 宛 余 的 。 因 为 元 余 关 系 是 不 必 
要 的 ， 而 我 们 又 试图 建立 最 小 化 的 数据 模型 ， 所 以 应 该 删除 元 余 的 关系 。 标 识 在 两 个 实体 之 
闻 是 否 有 多 条 路 径 相 对 比较 容易 ， 但 这 并 不 意味 着 这 些 关 系 之 中 有 宛 余 的 ， 因 为 它们 可 能 代 
表 着 用 户 的 不 同 的 关系 。 

例如 ， 考 虑 图 9-11 中 VideoForRent、RentalAgreement 和 Member 实 体 间 的 关系 ， 有 两 种 方 
法 可 以 查看 哪个 会 员 租 借 了 哪些 录像 。 使 用 Member 和 VideoForRent 实 体 间 的 Rents 关 系 可 以 有 
一 个 直接 的 路 径 ， 而 且 通 过 RentalAgreement 实 体 使 用 Requests 和 IsPartOf 关 系 则 有 一 个 间接 的 
通路 。 在 访问 这 两 个 通路 之 前 ， 我 们 需要 建立 每 个 关系 的 目的 。Rents 关 系 表明 哪个 会 员 租 借 
了 哪些 录像 。 另 一 方面 ，Requests 关 系 表明 哪个 会 员 拥 有 哪些 租借 协议 ， 而 IsPartOf 关 系 表明 
哪些 录像 与 哪些 租借 协议 有 关 。 尽 管 在 会 员 和 他 们 租借 的 录像 之 间 确 实 存 在 关系 ， 但 这 个 关 
系 不 是 直接 的 ， 通 过 租借 协议 所 表达 的 关系 会 更 准确 。 因 此 Rents 关 系 是 元 余 的 ， 这 个 关系 并 
没有 为 VideoForRent 和 Member 直 接 的 关系 带 来 任何 附加 的 信息 ，VideoForRent 和 Member 间 的 
关系 可 以 更 简单 地 通过 RentalAgreement 实 体 得 到 。 为 确保 我 们 创建 一 个 最 小 的 模型 ， 必 须 将 
元 余 的 Rents 关 系 删 掉 。 

3. 当 访 问 宛 余 时 考虑 时 间 尺 度 

当 访问 元 余 时 ， 关 系 的 时 间 尺 度 也 是 很 重要 的 。 例 如 ， 考 虑 在 实体 Man、Woman 和 Child 
之 间 建 立 关系 的 情况 ， 如 图 9-12 所 示 。 很 明显 ， 在 Man 和 Child 之 间 有 两 条 路 径 : 一 条 是 通过 直 
接 关 系 FatherOf (是 某 人 的 父亲 )， 另 一 条 是 通过 关系 MarriedTe (与 某 人 结婚 ) 和 MotherOf 
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(是 某 人 的 母亲 )。 这 样 ， 你 可 能 党 得 FatherOf 关 系 是 不 必要 的 。 但 这 可 能 是 不 正确 的 ， 原 因 有 
两 个 : 
。 父 亲 可 能 在 前 一 次 结婚 中 有 孩子 ， 而 我 们 通过 1:1 关 系 所 建 的 模型 只 是 父亲 当 前 婚姻 的 情况 。 
。 孩 子 的 父亲 和 母亲 可 能 没有 结婚 ， 或 者 孩子 的 父亲 和 孩子 的 母亲 以 外 的 人 结 了 婚 (或 者 
孩子 的 母亲 嫁 给 了 并 不 是 孩子 的 父亲 的 人 )。 
以 上 任何 一 种 情况 ， 都 必须 建立 FatherOf 关 系 。 


VideoForRent 
1..1 


IsPartOf 









大 Rents 













了 O..* 
RentalAgreement 











图 9-12 无 元 余 的 关系 
提示 这 里 要 说 明 的 意思 是 ， 当 访问 元 余 时 ， 检 查实 休 间 每 个 关系 的 意义 是 很 重要 的 。 


9.4.8 步骤 1.8: 检查 模型 是 否 支持 用 户 事 务 


目标 确保 ER 模型 支持 视图 所 需 的 事务 。 


现在 已 经 得 到 了 一 个 描述 公司 数据 需求 的 ER 模型 。 这 个 步 又 的 目标 就 是 检查 ER 模型 ， 确 
保 模型 支持 所 需要 的 事务 。 在 我 们 的 例子 中 ， StayHome 的 Branch 用 户 视图 的 事务 需求 列 在 
6.4.4 节 。 

使 用 ER 模型 和 数据 字典 ， 尝 试 手工 地 完成 操作 ， 如 果 可 以 以 这 种 方式 解决 所 有 事务 ， 就 
已 经 完成 了 ER 模型 是 否 支持 用 户 事务 的 检查 。 但 是 ， 如 果 不 能 手工 地 操作 一 个 事务 ， 则 数据 
模型 一 定 会 有 问题 存在 ， 而 且 这 个 问题 是 必须 要 解决 的 。 在 这 种 情况 下 ， 很 可 能 是 数据 模型 
中 丢失 了 一 个 实体 、 关 系 或 者 属性 。 

我 们 检查 两 个 可 能 的 方法 来 确保 ER 模型 支持 所 需 的 事务 

1. 描述 事务 

使 用 第 一 种 方法 ， 通过 将 每 个 事务 的 需求 描述 存档 ， 检查 模型 中 是 否 提供 了 事务 所 需 的 
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所 有 信息 实体、 关系 和 其 他 属性 )。 下 面 ， 让 我 们 来 检查 StayHome 的 一 个 示例 事务 的 需求 : 


| 事务 (0) 根据 分 公司 号 ， 列 出 了 每 个 分 公司 的 每 个 主管 的 名 字 。 


每 个 主管 的 名 字 均 包含 在 实体 Staff 中 ， 而 分 公司 的 具体 情况 包含 在 实体 Branch 中 。 这 里 
可 以 使 用 Staff Manages Branch 关 系 ， 找 出 每 个 分 公司 主管 的 名 字 。 

2. 使 用 事务 路 径 

第 一 个 方法 ， 根 据 必 需 的 事务 使 数据 模型 有 效 化 ， 可 以 在 ER 模型 中 以 图 形 方式 直接 描述 
每 个 事务 的 路 径 。 此 方法 的 一 个 例子 是 使 用 6.4.4 节 中 列 出 的 数据 查询 ， 如 图 9-13 所 示 。 很 明 
显 ， 事 务 越 多 ， 图 越 复 杂 。 为 了 使 可 读 性 良好 ， 可 能 需要 几 张 这 样 的 图 来 描述 所 有 事务 。 
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图 9-13 使 用 路 径 来 检查 ER 模型 是 否 支持 用 户 事务 












提示 这 些 看 起 来 很 难 ， 但 确实 是 这 样 。 因 此 ， 你 可 能 会 尽量 略 去 该 步骤 。 但 是 现在 进 
行 检查 比 将 来 做 要 好 得 多 ， 因 为 体会 发 现在 后 面 做 检查 要 复杂 得 多 ， 而 且 比 在 数据 模 
型 中 解决 问题 要 付出 更 多 的 代价 。 
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9.4.9 步骤 1.9: 与 用 户 一 起 检查 模型 


目标 ”与 用 户 一 起 检查 ER 模型 可 以 确保 此 模型 是 “真实 ”的 表达 了 企业 (和 企业 的 


一 部 分 ) 的 需求 。 


在 完成 步 又 1 之 前 ， 应 该 和 用 户 一 起 检查 ER 模型 。ER 模 型 包括 数据 字典 、ER 图 和 任何 附 
加 的 描述 数据 模型 的 文档 。 如 果 在 数据 模型 中 有 任何 异常 ， 必 须 进 行 相应 的 修改 ， 这 可 能 需 
要 重复 以 前 的 一 些 步 骤 。 你 应 该 重复 这 个 过 程 直 到 用 户 肯 定 这 个 模型 能 够 真实 地 表达 企业 
(或 企业 的 一 部 分 ) 的 需求 为 止 。 

在 下 面 的 各 章 中 ,我们 继续 后 边 的 主要 步 又 ,这些 步 只 将 数据 模型 映射 为 一 系列 表 的 集 
合 ， 并 检查 这 些 表 是 否 满足 用 户 的 需求 。 


9.5 本 章 小 结 


* 设计 方法 学 就 是 一 种 使 用 过 程 、 技 术 、 工 具 和 文档 来 支持 和 简化 设计 过 程 的 结构 化 的 
方法 。 

* 本 书 中 使 用 的 数据 库 设计 方法 学 有 两 个 主要 的 阶段 : 逻辑 数据 库 设 计 和 物理 数据 库 设 
计 。 , 

* 逻辑 数据 库 设计 是 基于 一 个 特定 数据 模型 来 构建 企业 中 使 用 的 数据 模型 的 过 程 ， 它 
独立 于 特定 的 DBMS 和 其 他 的 物理 因素 。 在 我 们 的 例子 中 ， 逻 辑 设计 是 基于 关系 模 
型 的 。 

* 物理 数据 库 设计 是 描述 在 二 级 存储 中 的 数据 库 如 何 实现 的 过 程 ， 它 描述 了 文件 的 组 织 
式 和 高 效 访问 数据 的 索引 ， 以 及 有 关 的 完整 性 约束 和 安全 性 限制 。 物 理 设计 与 具体 的 
DBMS 有 关 。 - 

“在 数据 库 设 计 中 ， 有 一 些 关键 的 因素 决定 数据 库 设计 是 否 成 功 ， 例 如 ， 与 用 户 进行 交互 
以 及 愿意 重复 一 些 步骤 。 

* 方法 学 中 步 又 1 的 主要 目的 是 构建 表达 企业 (或 企业 的 一 部 分 ) 的 数据 需求 的 ER 模型 。 

* ER 模型 包括 实体 、 关 系 、 属 性 、 属 性 域 、 候 选 键 、 主 键 和 备用 键 。 

* ER 模型 由 文档 描述 ， 文 档 包括 ER 图 和 一 个 数据 字典 。 

* 应 该 检查 BR 模型 以 确保 没有 任何 宛 余 并 支持 用 户 需要 的 事务 。 


复习 题 


9.1 描述 设计 方法 学 的 目的 。 

9.2 描述 数据 库 设 计 包含 的 主要 阶段 。 

9.3 标识 成 功 的 数据 库 设计 的 重要 因素 。 

9.4 讨论 在 数据 库 设计 过 程 中 ， 用 户 所 起 的 重要 作用 。 

9.5 讨论 与 逻辑 数据 库 设计 方法 学 有 关 的 每 个 步骤 的 主要 活动 。 
9.6 讨论 与 物理 数据 库 设 计 方法 学 有 关 的 每 个 步骤 的 主要 活动 。 
9.7 讨论 逻辑 数据 库 设 计 的 步 双 1 的 目的 。 

9.8 标识 与 逻辑 数据 库 设计 步骤 1 有 关 的 主要 任务 。 

9.9 讨论 从 用 户 的 需求 文档 中 标识 实体 和 关系 的 方法 。 








9.10 
9.11 
9.12 
9.13 


练习 


9.14 
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讨论 从 用 户 的 需求 文档 中 标识 属性 的 方法 以 及 属性 与 实体 和 关系 的 结合 。 
讨论 为 ER 模型 检查 元 余 的 方法 ， 给 出 一 个 例子 来 说 明 你 的 答案 。 

讨论 检查 一 个 ER 模型 是 否 支持 用 户 需要 的 事务 的 两 个 方法 。 

标识 并 描述 在 逻辑 数据 库 设计 步骤 1 中 产生 文档 的 目的 。 


标识 附录 E 中 给 出 的 每 个 案例 研究 中 的 实体 、 关 系 和 有 关 的 属性 ， 并 创建 ER 图 (不 
要 看 本 书 给 出 的 每 个 案例 研究 的 答案 )。 比 较 你 的 ER 图 和 答案 的 ER 图 ， 并 说 明 不 同 
之 处 。 
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本 章 主 题 : 

。 如 何 将 ER 模型 映射 为 表 集 合 。 

。 如何 使 用 规范 化 方法 检查 表 结 构 。 

* 如何 检查 所 建 的 表 是 否 支持 用 户 需要 的 事务 。 

。 如何 定义 和 存档 完整 性 约束 。 

本 章 讲述 了 逻辑 数据 库 设计 方法 学 (方法 学 的 介绍 见 附录 B) 中 的 第 二 个 步骤。 在 这 个 步 
又 中 ， 为 在 步骤 1 中 创建 的 ER 模型 创建 表 集 合 。 然后 通过 规范 化 方法 检查 表 的 结构 和 它们 是 
否 支持 用 户 的 事务 。 最 后 ， 在 最 终 的 逻辑 数据 模型 中 检查 所 有 的 业务 规则 。 


10.1 步骤 2: 将 ER 模型 映射 为 表 


目标 从 ER 模型 中 创建 表 ， 并 检查 这 些 表 的 结构 。 


这 个 步骤 的 主要 目标 是 为 步骤 1 中 建立 的 ER 模型 产生 表 的 描述 。 这 组 表 应 该 代表 逻辑 数据 
模型 中 实体 、 关 系 、 属 性 和 约束 。 然后 检查 每 个 表 的 结构 ， 确保 建 表 过 程 中 没有 产生 错误 。 
如 果 表 中 有 错误 ， 则 表明 在 建 表 的 过 程 中 或 在 ER 模型 中 仍 有 没 发 现 的 错误 。 步骤 2 中 的 任务 
包括 : 

*。 步 骤 2.1: 创建 表 。 

“ 步 又 2.2: 用 规范 化 方法 检查 表 结构 。 

* 步骤 2.3: 检查 表 是 否 支 持 用 户 事务 。 

“。 步 又 2.4: 检查 业务 规则 。 

“ 步 又 2.5: 与 用 户 讨论 逻辑 数据 库 设计 。 

我 们 使 用 上 一 章 步 又 1 中 为 StayHome 创 建 的 Branch 视 图 的 ER 模型 来 介绍 步 又 2 这 个 视图 
代表 Manager (管理 者 )、Supervisor (监理 ) 和 Assistant (助理 ) 用 户 视 图 。 


10.1.1 步骤 2.1: 创建 表 
目标 从 ER 模型 映射 表 集 合 。 


在 这 步 中 ， 为 ER 模型 创建 表 来 表达 实体 、 关 系 、 属性 和 约束 。 每 个 表 的 结构 来 源 于 ER 所 
描述 的 信息 ， 这 些 信 息 包括 ER 图 、 数据 字典 和 任何 其 他 相关 的 文档 。 我 们 使 用 关系 数据 库 定 
义 语 言 (Database Definition Language, DBDL ) 来 描述 每 个 表 的 组 成 。 使 用 DBDL， 首 先 指 
定 表 的 名 字 ， 在 后 面 跟着 该 表 的 简单 属性 的 名 字 ， 并 将 这 些 属性 的 名 字 插 在 括号 里 。 然 后 标 
识 该 表 的 主键 以 及 任何 备用 键 和 外 键 。 对 每 个 外 键 ， 还 要 给 出 包含 被 引用 主键 的 表 。( 关系 键 
定义 参见 2.2.3 节 。 ) 

我 们 将 使 用 StayHome 中 的 Branch 视 图 的 ER 模型 来 说 明 这 个 过 程 ， Branch 视 图 的 ER 模型 
如 图 9-9 所 示 。 但 在 某 些 情况 下 ， 有 必 训 添加 一 些 本 模型 中 没有 的 例子 来 说 明 特殊 的 要 志 。 
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(1) 如 何 表达 实体 

对 ER 模型 中 的 每 个 实体 ， 创 建 一 个 包含 实体 的 所 有 简单 属性 的 表 。 对 复合 属性 ， 仅 包含 
表 中 组 成 复合 属性 的 简单 属性 。 例 如 ， 对 复合 属性 address， 应 该 包含 它 的 简单 属性 street、 
city、state 和 zipCode。 如 果 可 能 ， 标 识 每 个 表 中 组 成 主键 的 列 。 对 图 9-9 中 所 示 的 实体 ， 应 该 


创建 如 图 10-1 所 示 的 初始 表 结构 。 





图 10-1 描述 图 8-16 所 示 实 体 的 初始 表 结构 


在 有 些 情况 下 ， 我 们 还 不 能 标识 出 组 成 表 的 所 有 列 。 原因 是 我 们 还 必须 要 描述 实体 间 的 
关系 。 这 意味 着 在 ER 模型 中 没有 表达 出 关系 之 前 我 们 不 能 标识 出 组 成 弱 实体 的 主键 的 列 . 由 
于 在 图 9-9 中 没有 弱 实 体 ， 因此 我 们 使 用 图 C-1 中 的 一 个 弱 实 体 VideoOrderLine 的 例子 ， 在 本 步 
观 的 最 后 讨论 这 个 弱 实 体 的 主键 列 的 标识 。 

(2) 如 何 表达 关系 

一 个 实体 与 另 一 个 实体 间 的 关系 (关系 在 7.2 节 讨论 ) 由 主键 /外 键 机 制 表达 。 为 了 决定 将 
外 键 属性 放 在 哪里 ， 首 先 必 须 标识 关系 中 包含 的 “ 父 ”实体 和 “ 子 ” 实体 。 父 实体 指 的 是 把 
自己 的 主键 拷贝 到 代表 子 实 体 的 表 中 作为 外 键 的 实体 。 

我 们 考虑 不 同类 型 的 关系 和 多 值 属性 的 父 / 子 实体 的 标识 : 

?+ 对 多 《15*) 三 元 关系 

“一 对 多 (1:*) 递归 关系 

?对 1:1 入 三 元 关系 

* 一 对 一 (1:1) 递归 关系 

“多 对 多 | (*;*) 王 元 关系 

。 复 杂 关 系 

。 多 值 属性 

1 下 对 条 81 志 元 关 这 

对 每 个 1:* 二 元 关系 ,(1:* 关 系 在 7.5.2 节 讨论 )， 关系 “一 ”端的 实体 被 设计 为 父 实体 ， 
“多 ”端的 实体 被 设计 为 子 实体 。 为 了 描述 这 种 关系 ， 父 实 体 主键 的 拷贝 ， 被 放置 在 子 实体 的 
表 中 ， 作 为 外 键 。 
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现在 ， 由 图 9-9 所 示 的 Branch Has Staff 关 系 来 看 怎样 将 1:* 关 系 描述 为 表 。 在 这 个 例子 中 ， 
Branch (分 公司 ) 在 “一 ” 边 ， 代 表 了 父 实体 ; Staff 在 “多 ” 边 ， 代 表 了 子 实体 。 这 两 个 实体 
间 的 关系 是 通过 将 Branch ( 父 ) 实体 的 主键 (叫做 branchNo ) 拷贝 到 Staff ( 子 ) 表 中 建立 的 。 
图 10-2a 说 明了 Branch Has Staff ER 图 ， 图 10-2b 显 示 了 相应 的 表 。 


ED 












a) ER 模型 
branchNo 用 来 表示 Has 关 系 
Branch (branchNo, street, city, state, zipCode) Staff (staffNo, name, position, salary branchNo) 
Primary Key branchNo Primary Key staffNo ‘ 
Foreign Key branchNo references BranchtbranchNo) 
表示 引用 父 
表 的 外 键 4 
b) 表示 为 表 . 





图 10-2 1:* 关系 Branch Has Staff 


图 9-9 中 还 有 几 个 其 他 的 1:* 关系 的 例子 ， 如 Director Directs Video 和 Member Requests 
RentalAgreement。 对 局 部 逻辑 数据 模型 中 的 每 个 1:* 关系 都 应 该 重复 上 述 给 出 的 过 程 。 


在 1:* 关系 有 一 个 或 多 个 属性 的 情况 下 ， 这 些 属性 也 应 随 着 主键 加 到 子 表 中 。 例 如 ， 
如 果 Branch Has Staff 关 系 有 一 个 叫做 dateStart( 开 始 日 期 ， 代 表 一 个 成 员 加 入 分 公司 的 开 
始 时 间 ) 的 属性 ， 则 这 个 属性 也 应 随 着 Branch 表 主键 的 拷贝 加 入 到 Staff 表 中 。 


2. 一 对 多 (1:*) 递归 关系 

1:* 递归 关系 的 表示 与 上 面 所 介绍 的 很 类 似 。 在 图 9-9 中 ， 有 一 个 1:* 递归 关系 (递归 关系 
在 7.2.2 节 中 定义 ): Staff Supervises Staff。 这 时 ， 父 实体 和 子 实体 都 是 Staf。 根 据 上 面 给 出 的 
规则 ， 应 把 Staff( 父 ) 实 体 的 主键 拷贝 到 Staff( 子 ) 表 中 来 表达 Supervises 关 系 ， 这 时 就 应 该 建立 
这 个 列 的 第 二 个 拷贝 来 作为 外 键 。 这 个 列 的 拷贝 被 重新 命名 为 supervisorStaffNo， 由 此 来 更 好 
”地 表示 它 的 意思 。 图 10-3a 说 明了 Staff Supervises Staff ER 模型 ， 图 10-3b 显 示 了 相应 的 表 ( 包 
含 完 整 的 Branch Has Staff 关 系 )。 

3. 一 对 一 (1:1) 二 元 关系 

创建 代表 1:1 关 系 (1:1 关 系 在 7.5.1 节 定义 ) 的 表 稍微 有 些 复杂 ， 因为 不 能 使 用 元 组 的 数目 
来 标识 一 个 关系 中 的 父 实 体 和 子 实 体 ， 而 是 需要 使 用 参与 (参与 的 定义 见 7.5.5 节 ) 过 程 来 决 
定 是 把 实体 结合 为 一 个 表 来 表示 关系 好 ， 还 是 建 两 个 表 由 外 键 来 表示 关系 好 。 我 们 考虑 如 何 
建 表 来 表示 如 下 的 参与 约束 : 
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志 Supervises 


Supervisee 上 
人 
| 
0..1 | 


Supervisor 





Staff 













staffNo 


a) ER 模型 


stafftNo 用 来 表示 Supervises 关 系 
放 重 命名 supervisorStaffNo 


一 一 一 - 


Staff (staffNo, name, position, salary, branchNo, supervisorStaffNo) 
Primary Key staffNo 
Foreign Key branchNo references Branch(branchNo) 

Foreign Key supervisorStaffNo references Staff(staffNo) 











branchNo 用 来 表示 
Branch Has Staff 关 系 ， 






b) 表示 为 表 
图 10-3 1:* 递归 关系 Staff Supervises Staff 


“ 11 关系 的 两 边 都 是 强制 参与 。 

“ 11 关系 的 一 边 是 强制 参与 。 

* 1:1 关 系 的 两 边 均 为 可 选 参 与 。 

(1) 1:1 关 系 的 两 边 都 是 强制 参与 

在 这 种 情况 下 ， 应 该 将 实体 组 合 为 一 个 表 ， 并 选择 初始 实体 中 的 一 个 主键 作为 新 表 的 主 
键 ， 其 他 的 主键 用 作 备 用 键 。 

在 图 9-9 所 示 的 关系 中 没有 这 样 的 例子 。 然 而 ， 让 我 们 看 一 下 如 何 表达 称 为 Staff Uses Car 的 
1:1 关 系 ， 其 所 涉及 的 两 个 实体 均 是 强制 参与 ， 如 图 10-4a 所 示 。Car 实 体 的 主键 是 车 牌号 
(vehLicenseNo) , 另 两 个 属性 为 make 和 model。 在 这 个 例子 中 ， 把 实体 Staft 和 Car 的 所 有 属性 放 入 
个 表 中 。 选 择 一 个 主键 作为 新 表 的 主键 ， 如 staffNo、 另 一 个 就 成 为 了 备用 键 ， 如 图 10-4b 所 示 ， 


在 这 个 例子 中 ， 有 强制 参与 的 1:1 关 系 的 两 边 者 有 一 个 或 多 个 属性 ， 这 些 属性 也 应 
该 被 包括 在 描述 实体 和 关系 的 表 中 。 例 如 ， 如 果 Staff Uses Car 关 系 有 一 个 叫做 dateStart 
的 属性 ， 则 这 个 属性 也 应 该 是 StaffCar 表 中 的 一 列 ， 


注意 ， 仅 当 在 两 个 实体 之 间 没有 其 他 关系 的 时 候 ， 才 有 可 能 把 两 个 实体 合并 到 一 张 表 中 
如 果 还 存在 其 他 关系 ， 则 应 该 用 主键 /外 键 机 制 来 描述 Staff Uses Car 关 系 。 我 们 在 第 二 部 分 只 
简要 地 讨论 如 何 设计 这 种 情况 下 的 父 实体 和 子 实体 。 

(2) 1:1 关 系 的 一 边 是 强制 参与 

在 这 种 情况 下 ， 可 以 使 用 参与 约束 来 标识 1:1 关 系 的 父 实体 和 子 实体 。 关 系 中 的 可 选 参与 
的 实体 被 设计 为 父 实体 ， 关 系 中 的 强制 参与 的 实体 被 设计 为 子 实 体 。 正 如 前 面 所 说 的 ， 父 实 
体 主键 的 拷贝 ， 被 放置 在 描述 子 实体 的 表 中 。 

将 有 可 选 参与 的 实体 ( 父 实体 ) 的 主键 拷贝 到 有 强制 参与 的 实体 ( 子 实体 ) 中 的 原因 是 ， 因 
为 这 个 主键 的 拷贝 (外 键 ) 将 总 是 持 有 一 个 值 ， 从 而 避免 了 在 结果 表 中 这 个 列 出 现 空 什 。 如 果 我 
们 不 遵守 这 个 规则 ,并 选择 将 外 键 放置 在 表示 有 可 选 参 与 的 实体 的 表 中 , 则 这 个 列 将 会 包含 空 值 。 
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Staff Uses > 











staffNo ll ll vehLicenseNo | 





用 于 Car 实 体 的 用 丁 Staff 实 体 的 
强制 参与 强制 参与 
3) ER 模型 
Staff 的 列 Car 的 列 





TT 


StaffCar (staffNo, name, position, salary, branchNo, supervisorStaffNo, 和 make, model) 


Primary Key staffNo 
Aifternate Key vehLicenseNo 
Foreign Key branchNo references Branch(branchNo) 
Foreign Key SupervisorStaffNo references StafffstaffNo) 
b) 使 用 DBDL 描 述 表 灾 为 备用 刍 


图 10-4 两 个 实体 均 有 强制 参与 的 1:1Staff Uses Car 关 系 









用 于 Car 实 体 的 
强制 参与 






用 于 Staff 实 体 
的 可 选 参与 












a) ER 模型 

staffNo 用 于 表示 Uses 关 系 
Staff (staffNo, name, position, salary, 
branchNo, supervisorStaffNo) Car (vehLicenseNo, make, model, staffNo) 
Primary Key staffNo Primary Key vehlLicenseNo 
Foreign Key-branchNo references Alternate Key staffNo 
Branch(branchNo) Foreign Key staffNo references 
Foreign Key supervisorStaffNo references Staff(staffNo) 
Staff(staffNo) 

stafftNo 变 为 外 
和 备用 
b) 表示 为 表 e . 条 。 所 


图 10-5 有 强制 参与 的 Car 实 体 和 可 选 参与 的 Staff 实 体 的 1:1 Staff Uses Car 关 系 . 
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党 光 qDUeIg S98eueW 有 8IS 赤 与 涉 驴 二 毕 末 泛 H8IS 梓 出 “与 季 阳 地 二 于 关 qoue1g 仪 9-01 图 


举 于 慰 19gqd 则 以 (4 


(ONJJeSs)JB1S S33U319J31 ONJPISIOsSIAIadns A34 USES20F 
(oNUoueIq)qouelg $33031331 ONUO2Uelq 人 9X UBRIOF 

ONBels 43X renaRd 

(oONJjelSIosfAzadns ‘ONUIUEIq refes ‘UONISOd ‘teu 'ONJe3s) HES 


(ONJe1S)DJe1S S30U319J31 ONJEISIBU A34 uSyaaoy 


ONUD2ueIzq 人 ay 《rernpd 
(oONJJe1SI8ua '3poDdfz "alels A 34aanHs ONDUPIG) oueag 


[人 


oONBeSI3ua% 尿 电 醒 并 
“党 关 ss3eueJNS 举 二 出 oNJJels 





尝 尖 SeHS 举 二 出 oONHouezq 


三 痊 M9 (e 


与 爱 障 环 山 
尾 治 qouezg 二 出 









于 关于 
雏 泌 尖 seH 士 出 


尖 sa3eue 内 二 出 





seueH > 


归 学 尖 seH 士 出 


与 泪 牧 全 
关 音 头 BeS 于 出 














$Y 慎 状 十 十 深 


汰 sa8eue 内 二 出 
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现在 我 们 只 对 Car 实 体 考虑 如 何 描述 具有 强制 参与 的 Staff Uses Car 1:1 关 系 ， 如 图 10-5a 所 
示 。 在 关系 中 具有 可 选 参 与 的 Staff 实 体 被 设计 为 父 实体 ， 而 在 关系 中 有 强制 参与 的 Car 实 体 被 
设计 为 子 实体 。 因 此 ， Staff 实 体 ( 父 实体 ) 主 键 的 拷贝 (staffNo) 放置 在 了 Car 实 体 ( 子 实体 ) 
的 表 中 ， 如 图 10-5b 所 示 。 在 这 种 情况 下 ，staffNo 也 成 为 了 Car 表 的 备用 键 。 

图 9-9 中 也 有 单 边 强制 参与 的 1:1 关 系 的 一 个 例子 ， 它 就 是 Staff Manages Branch 关 系 ， 它 
只 有 Branch 实 体 这 一 边 为 强制 参与 。 按 照 上 面 的 规则 ，Staff 实 体 设计 为 父 实体 ， Branch 实 体 
设计 为 子 实 体 。 因 此 ，Staff( 父 ) 实 体 的 主键 的 拷贝 一 一 staftNo， 应 复制 到 Branch ( 子 ) 表 中 ， 
并 重新 命名 为 mgrStaffNo， 以 便 更 清晰 地 表达 Branch 表 中 的 外 键 含义 。 图 10-6a 为 Staff 
Manages Branch 的 ER 模型 ， 图 10-6b 中 为 相对 应 的 表 。 
在 只 有 一 边 实体 强制 参与 的 1:1 关 系 中 有 一 个 或 多 个 属性 的 情形 中 ， 这 些 属性 也 应 
该 随 其 主键 加 入 到 子 表 中 。 例 如 ， 如 果 Staff Manages Branch 关 系 有 一 个 叫做 dateStart 的 
属性 ， 则 这 个 属性 将 随 着 staffNo( 重 命名 为 mgrStaffNo) 的 拷贝 加 入 到 Branch 表 中 ， 成 为 
该 表 中 的 一 列 。 








(3) 1:1 关 系 的 两 边 均 为 可 选 参与 

在 这 种 情况 下 ， 父 实体 和 子 实体 之 间 的 设计 是 任意 的 ， 除 非 你 可 以 得 到 关于 关系 的 更 多 
信息 来 帮助 你 判断 使 用 哪个 设计 。 | 

让 我 们 考虑 如 何 描述 两 边 都 是 可 选 参 与 的 Staff Uses Car 关 系 ， 这 个 关系 是 1:1 的 ， 如 图 
10-7a 所 示 (注意 , 下面 的 讨论 与 具有 两 边 强制 参与 的 1:1 关 系 也 是 有 关 的 ， 但 这 时 不 能 把 所 有 
的 选项 都 放 在 一 个 表 中 )。 如 果 没 有 额外 的 信息 帮助 你 选择 父 、 子 实体 ， 则 你 的 选择 就 是 任意 
的 。 换 名 话说 ， 你 既 可 以 把 Staff 实 体 的 主键 拷贝 到 Car 实 体 中 .也 可 以 反 过 来 做 。 


然而 ， 让 我 们 假设 你 发 现 大 部 分 汽车 (car)， 但 不 是 所 有 的 都 被 员工 使 用 ， 而 只 有 一 小 部 
分 员工 使 用 汽车 。 现 在 ， 可 以 说 Car 实 体 (尽管 是 可 选 的 ) 比 Staff 实 体 更 接近 于 强制 类 型 。 因 
此 ， 可 以 令 Staff 实 体 为 父 实体 ， 令 Car 实 体 为 子 实体 ， 并 且 将 Staff 实 体 主键 (staffNo) 的 拷贝 
放置 在 Car 表 中 ， 如 图 10-7b 所 示 (Staff 表 和 Car 表 的 组 合 ， 与 前 面 讨论 的 在 一 边 具有 强制 参与 
的 1:1 关 系 的 例子 一 样 )。 

4. 一 对 一 (1:1) 递归 关系 

对 于 1:1 递 归 关 系 ， 应 该 遵循 上 面 所 描述 的 对 1:1 关 系 的 “参与 ”规则 。 但 是 ， 在 这 种 特殊 
的 1:1 关 系 情景 中 ， 关 系 两 边 的 实体 是 相同 的 ， 对 于 在 两 边 有 强制 参与 的 1:1 递 归 关 系 ， 应 该 用 
主键 的 两 个 拷贝 来 把 这 个 递归 关系 描述 为 一 个 表 。 同 前 面 一 样 ， 主 键 的 一 个 拷贝 代表 外 键 ， 
并 且 应 该 将 它 重新 命名 来 表示 它 代表 的 关系 。 

对 于 一 边 是 强制 参与 的 1:1 递 归 关 系 ， 你 既 可 以 向 前 面 描述 的 那样 ， 用 主键 的 两 个 拷贝 创 
建 一 个 新 表 ， 也 可 以 创建 一 个 新 表 来 代表 关系 。 这 个 新 表 只 有 两 个 列 ， 都 是 主键 的 拷贝 。 同 
前 面 一 样 ， 主 键 的 拷贝 作为 外 键 ， 并 且 必 须 重新 命名 来 表示 在 表 中 的 意思 。 

对 于 两 边 是 可 选 参 与 的 1:1 递 归 关 系 ， 应 该 像 前 面 所 描述 的 那样 创建 一 个 新 表 。 

5. 多 对 多 (*:*) 二 元 联系 

对 于 每 个 *:* 二 元 联系 ， 创 建 一 个 表达 关系 的 表 ， 这 个 表 包 含 关系 的 任何 属性 。 我 们 将 参 
与 关系 的 实体 的 主键 属性 拷贝 到 新 表 中 ， 使 之 作为 外 键 。 一 个 外 键 或 全 部 外 键 将 组 成 新 表 的 
主键 ， 可 能 要 结合 此 关系 的 一 些 属 性 。 
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Uses > 








staffNo 


| vehLicenseNo | 


用 Staff 实体 的 
可 进 参 与 A 






用 乓 Car 实 体 的 
串 选 参与 






a) ER 模型 
staffNo 用 于 表示 Uses 关 系 


一 一 一 和 


Staff (staffNo, name, position, salary, * 

branchNo, SupervisorStaffNo} Car (vehLicenseNo, make, model, StaffNo} 
Primary Key staffNo Primary Key vehLicenseNo 

Foreign Key branchNo references Branch(branchNo) Altemate Key staffNo | 
Foreign Key supervisorStaffNo references Staff(staffNo) Foreign Key staffNo references Sraff(staffNo} 


b) 表示 为 表 
图 10-7 两 个 实体 都 是 可 选 参 与 的 1:1 Staff Uses Car 关 系 








例如 ， 考 虑 图 9-9 所 示 的 Actor PlaysIn Video 这 个 *:* 关 系 。 这 个 *:* 关 系 两 边 的 实体 分 别 为 
Actor 和 Video ， 作 为 父 实体 ， 将 它们 的 主键 (actorNo 和 catalogNo) 复制 到 叫做 Role 的 新 表 中 
来 表达 这 个 关系 。 注意 ，PlaysIn 关 系 有 一 个 叫做 character 的 属性 、 这 个 属性 也 被 包含 在 Role 
表 中 。 图 10-8a 所 示 的 为 Actor PlaysIn Video ER 图 ， 图 10-8b 所 示 的 是 相应 的 表 。 





PlaysIn 关 系 
的 父 实 体 






Playsln 关系 






























Video 二 Playsin Actor 
catalogNo 1..* 0..* actorNo 
CataiogNo 被 放 和 到 a) ER 图 actorNo 被 放 到 称 
称 为 Role 的 新 表 中 为 Role 的 新 表 中 表 
表示 Playsin 关 系 


未 PlaysIn 类 系 












Video (catalogNo, title, Category, dailyRental, price, directorNo) 
Primary Key catalogNo 


Foreign Key directorNo references Director(directorNo) 


Actor (actorNo, actorName) 
Primary Key actorNo 


character 关系 的 
Playsin 必 性 

Role (catalogNo, actorNo, character) 

了 Primary Key catalogNo, actorNo 

Foreign Key CatalogNo references Video(catalogNo) 

Foreign Key actorNo references Actor(actorNo) 


b) 对 应 的 表 
图 10-8 *:* Actor PlaysIn 关 系 








注意， 叫做 Role 的 新 表 有 一 个 复合 主键 ， 这 个 主键 由 两 个 外 键 (catalogNo 和 actorNo) 组 成 。 

6. 复杂 关系 类 型 

有 多 于 两 个 参与 实体 的 关系 是 复杂 关系 ， 为 每 个 复杂 关系 创建 一 个 表达 关系 的 表 ， 将 参 
与 复杂 关系 的 这 些 实体 的 主键 复制 到 新 表 中 ， 并 作为 外 键 ， 此 表 还 包含 与 关系 相关 的 全 部 属 
性 。 一 个 或 多 个 外 键 将 组 成 新 表 的 主键 ， 还 可 以 加 上 关系 中 的 一 些 其 他 属性 。 

例如 ， 复 杂 (三 元 ) 关系 Registers 表 达 了 图 9-9 中 所 示 的 作为 分 公司 的 一 个 新 会 员 注册 的 
会 员 、 职 工 和 分 公司 间 的 关系 。Registers 周 围 有 Staff、 Member 和 Branch 三 个 实体 ， 它 们 作为 
父 实体 ,我 们 将 这 些 实体 的 主键 (staffNo、MemberNo 和 branchNo ) 复制 到 一 个 叫做 
Registration 的 新 表 中 ， 这 个 新 表 表 达 了 这 个 关系 。 注 意 ， Registers 关 系 有 一 个 叫做 dateJoined 
的 属性 ， 这 个 属性 也 包含 在 Registration 表 中 。 图 10-9a 显 示 了 Registers 复 杂 (三 元 ) 关系 的 ER 
图 ， 图 10-9b 显 示 了 相应 的 表 。 















Registers 关 
系 的 父 实体 


Staff 
staffNo 


Registers 关 
系 的 父 实体 


Branch 
branchNo 册 


Registers 关 
系 的 父 实体 













Member 





memberNo 





a) ER 图 


branchNo 放 到 
Registration 表 中 
表示 Registers 关 系 










Branch (branchNo, street, city, state, zipCode, mgrStaffNo) 
Primary Key branchNo 
Foreign Key mgrStaffNo references Staff(staffNo) 


staffNo 放 到 Registration 表 中 表示 Registers 关 系 


Staff (staffNo, name, position, salary branchNo, supervisorStaffNo) ; 
Primary Key staffNo ! 
Foreign Key branchNo references branch(branchNo) 


Foreign Key supervisorStaffNo references | 





Member (memberNo, fName, IName, address) 
Primary Key memberNo 





表 中 表示 Registers 关 系 


sis 


Registration (branchNo, memberNo, staffNo, datejJoined} 


| 
| 
mermberNo 放 到 Registration 
| 


Primary Key branchNo, memberNo ; y 
Foreign Key branchNo references Branch(branchNo) Registers 关 系 中 
Foreign Key memberNo references Member(memberNo) 的 dateJoined 属 性 
Foreign Key staffNo references Staff(staffNo) 

b) 对 应 的 表 


图 10-9 复杂 的 Registers 关 系 
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7. 多 值 属性 

对 于 每 个 与 实体 有 关 的 多 值 属性 ， 应 该 遵守 上 述 1:* 关 系 中 所 描述 的 规则 。 在 一 端的 实体 
被 指定 为 父 实体 ， 在 多 端的 多 值 属性 被 指定 为 子 实体 。 创 建 一 个 新 的 表 包 含 这些 多 值 属性 ， 
并 将 父 实体 的 主键 拷贝 过 来 作为 外 键 。 除 非 多 值 属性 自己 本 身 是 父 实体 的 备用 键 ， 否 则 新 表 
的 主键 由 多 值 属性 和 父 实体 的 原始 主键 组 成 。 

例如 ， 要 表达 有 三 部 电话 的 分 公司 的 情况 ，Branch 实 体 定义 telNo 属 性 多 值 属 性 。 要 表 
达 这 个 关系 ,我们 创建 一 个 新 的 叫做 Telephone 的 表 来 表达 多 值 属性 telINo。 图 10-10a 说 明 
了 Branch 实 体 的 ER 图 ， 这 个 图 中 只 显示 了 主键 和 telNo 多 值 属性 ， 图 10-10b 显 示 了 对 应 的 
表 。 


Branch 


branchNo {PK} 
telNo [1..3] 


a) ER 图 
branchNo 在 Telephone 表 中 作为 外 键 





telNo 移 到 Telephone 表 中 





” Branch (branchNo, street, city, state, zipCode, telNo [1..3], mgrStaffNo) 
Primary Key branchNo 
Foreign Key mgrStaffNo references Staff(staffNo) 


Branch (branchNo, street, city, state, zipCode, mgrStaffNo) Telephone (telNo, branchNo) 
Primary Key branchNo Primary Key telNo 
Foreign Key mgrStaffNo references Staff(staffNo) Foreign Key branchNo references Branch(branchNo) 


b) 对 应 的 表 
| 图 10-10 Branch 实 体 的 多 值 telNo 属 性 
在 表 10-1 中 ， 我 们 总 结 了 如 何 用 表 表 达 实体 、 关 系 和 多 值 属性 。 
在 数据 库 设计 方法 学 的 步骤 1.6 中 ,我们 给 出 了 使 用 特 化 / 泛 化 的 增强 的 ER 概念 来 表达 实 
体 ， 第 11 章 会 详细 描述 这 部 分 内 容 ， 我 们 也 将 在 第 11 章 介绍 如 何 将 增强 的 概念 映射 到 表 中 。 
表 10-1 如 何 将 实体 、 关 系 和 多 值 属性 表达 为 表 的 总 结 


实体 /关系 /属性 表达 为 表 

强 实体 或 弱 实 体 创建 包含 所 有 简单 属性 的 表 

1:* 二 元 关系 将 “一 ” 端 实体 的 主键 复制 到 表达 “多 ” 端 实体 的 表 中 ， 关 系 
中 的 任何 属性 也 复制 到 “多 ”端的 表 中 

1:* 递 归 关 系 “一 ”端的 实体 和 “多 ”端的 实体 是 一 样 的 ， 代表 实体 的 表 有 
主键 的 另 一 个 拷贝 ， 这 个 拷贝 是 被 重 命名 的 ， 并 且 有 关系 的 其 他 
属性 

1:1 二 元 关系 : 

两 端 都 是 强制 参与 将 实体 组 合成 -- 张 表 

一 端 是 强制 参与 将 有 可 选 参 与 的 实体 的 主键 复制 到 表达 有 强制 参与 的 实体 的 表 
中 ， 关系 的 属性 也 被 复制 到 表达 有 强制 参与 的 实体 的 表 中 

两 端 都 是 可 选 参与 没有 更 多 的 信息 ， 将 一 个 实体 的 主键 拷贝 到 另 一 个 实体 中 。 但 


如 果 信 息 是 可 获得 的 ， 则 将 更 具有 强制 参与 的 实体 作为 子 实体 
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( 续 ) 
实体 /关系 /属性 表达 为 表 
*:* 二 元 关系 /复杂 关系 创建 表达 关系 的 表 ， 此 表 中 包含 任何 与 关系 有 关 的 属性 ， 将 每 
个 父 实体 中 的 主键 复制 到 新 表 中 作为 外 键 
多 值 属性 创建 一 个 表达 多 值 属性 的 表 ， 并 将 父 实体 的 主键 复制 到 新 表 中 
作为 外 刍 
将 表 和 外 键 属性 存档 


在 步骤 2.1 的 结尾 ， 将 从 逻辑 数据 模型 得 来 的 表 的 全 部 组 成 部 分 进行 存档 。StayHome 数 据 
库 应 用 程序 的 Branch 视 图 的 所 有 表 显 示 在 图 10-11 中 。 












Role actorNo, Staff {staffNo, name, position, salary, branchNo, supervisorStaffNo) 
Primary Key catalogNo, actorNo Primary Key staffNo 

Foreign Key catalogNo references Video(catalogNo} Foreign Key branchNo references Branch{branchNo) 

Foreign Key actorNo references ActortactorNo) Foreign Key supervisorStaffNo references Staffl(staffNo) 











Telephone (telNo, branchNo) Video (catalogNo, titie, category, dailyRental, priee, directorNoy 
Primary Key teiNo Primary Key catalogNo 

| Foreign Key branchNo references Branch(branchNo) Foreign Key directorNo references Director(directorNo) 

| | VideoForRent (videoNo, available catalogNo, branchNo) 4 
Primary Key VideoNo 








| Foreign Key catalogNo references VideotcatalogNo) 
Foreign Key branchNo references Branch(branchNo} 









Ss 一 一 一 





图 10-11 StayHome 数 据 库 应 用 的 Branch 视 图 中 的 表 


既然 每 个 表 都 有 了 自己 的 全 部 列 的 集合 ， 现 在 就 可 以 标识 任何 新 的 主键 或 备用 键 了 。 这 对 
于 依赖 于 从 父 实体 那里 拷贝 主键 来 组 成 自己 的 主键 的 弱 实体 来 说 尤其 重要 。 例 如 ， 附 录 C 的 图 
C-1 中 显 示 的 VideoOrderLine 弱 实体 有 一 个 复合 主键 ， 此 主键 由 实体 Video 的 主键 catalogNo 的 拷 
贝 和 实体 VideoOrder 的 主键 OrderNo 的 拷贝 共同 组 成 。 如 图 C-2 所 述 。 

可 以 扩展 DBDL 的 语法 来 表示 外 键 的 完整 性 约束 ， 你 将 在 步骤 2.4 看 到 这 些 。 同时 也 应 
该 更 新 数据 字典 来 表明 这 个 步骤 中 新 出 现 的 主键 和 备用 键 的 存在 。 例 如 ， 加 入 主键 之 后 ， 
表 RentalAgreement 获 得 了 一 个 新 的 备用 键 ， 该 备用 键 由 memberNo、 VideoNo 和 dateOut 共 
同 组 成 。 


10.1.2 步骤 2.2: 用 规范 化 方法 检查 表 结 构 


目标 ”检查 和 使 用 规范 化 标准 ， 使 每 个 表 的 结构 正确 。 


这 个 步 又 的 目的 是 检查 步 又 2.1 中 创建 的 每 个 表 中 的 列 的 组 成 。 用 规范 化 方法 检查 每 个 表 
的 组 成 来 避免 不 必要 的 数据 重复 。 





锣 10 香 逻 帮 数据 府 仙 太一 步 又 2 151 


应 该 确保 步骤 2.1 中 所 建 的 每 个 表 至 少 是 第 三 范式 (3NE) 的 。 如 果 所 标识 的 表 不 是 第 三 
范式 的 ， 可 能 表明 ER 模型 的 某 部 分 是 错误 的 ， 或 者 由 模 术 创 建 表 时 产生 了 错误 。 如 果 必 要 的 
话 ， 可 能 需要 重新 构造 数据 模型 或 者 表 。 


10.1.3 步骤 2.3: 检查 表 是 否 支持 用 户 事 务 


目标 确保 所 建 表 支持 用 户 所 需 的 事务 。 |] 


这 个 步骤 的 目标 是 检查 步骤 2.1 中 所 建 的 表 是 否 如 用 户 需求 说 明 中 所 要 求 的 那样 ， 支 持 用 
户 所 需 的 事务 。 这 种 类 型 的 检查 在 步骤 1.8 中 已 经 进行 过 ， 它 是 确保 局 部 逻辑 数据 模型 支持 所 
需求 的 事务 。 在 这 个 步骤 中 ， 是 检查 前 面 步骤 所 建 的 表 是 否 也 支持 这 些 事务 ， 并 由 此 确保 在 
建 表 的 时 候 ， 没 有 错误 发 生 。 

检查 表 是 否 支 持 事务 的 一 种 方法 是 检查 是 否 支持 事务 的 数据 需求 ， 以 确保 数据 在 一 个 或 
多 个 表 中 存在 。 同 时 ， 如 果 事 务 所 需求 的 数据 在 多 个 表 中 ， 则 应 该 检查 这 些 表 是 否 能 够 通过 
主键 /外 键 机 制 连接 起 来 。 我 们 通过 检查 6.4.4 节 中 所 给 的 事务 的 例子 来 说 明 这 种 方法 。 表 10-2a 
给 出 了 数据 项 和 更 新 /删除 事务 ， 表 10-2b 给 出 了 StayHome 的 Branch 视 图 的 查询 事务 ， 这 两 个 
图 同时 给 出 了 每 个 事务 所 需要 的 表 。 在 这 里 ， 我 们 加 重 显示 了 事务 所 需要 的 列 ， 必要 时 还 可 
包括 在 连接 表 中 的 列 。 

从 这 些 分 析 得 出 ， 图 9-8 所 示 的 表 支 持 StayHome 的 Branch 视 图 的 所 有 事务 。 在 第 17 章 中 ， 
我 们 将 使 用 Microsoft Access DBMS 来 说 明 对 表 10-2bp 所 示 的 一 些 查询 事务 的 实现 。 

表 10-2a) StayHome 的 Branch 视 图 的 数据 项 和 更 新 /删除 事务 所 需 的 表 











事务 需求 的 表 

(a) 输入 一 个 新 的 分 公司 的 详细 信息 Branch (branchNo, street, city, state, zipCode, 
mgrStaffNo) 

(g) 更 新 /删除 分 公司 的 详细 信息 Telephone (telNo, branchNo) 
外 键 branchNo3| 用 Branch (branchNo) 

(b) 输入 分 公司 中 --…- 个 新 成 员 的 详细 信息 Staff Staff (staffNo , name, position, salary, branchNo, 

(h) 更 新 /删除 分 公司 成 颁 的 详细 信息 supervisorStaffNo) 

(c) 输入 新 出 版 的 录像 的 详细 信息 Viden (catalogNo, titie, category, dailyRental, price, directorNo) 

{i) 更 新 /删除 已 有 的 录像 的 详细 信息 外 键 directorNo 引 用 Director (directorNo) 


Director (directorNo , directorName ) 





Role (catalogNo , actorNo ， character) 
外 键 CatalogNo 引 用 Video(catalogNo) 
外 键 actorNo 引 用 Actor(actorNo) 

Actor (actorNo, actorName) 











(gd) 输入 已 有 分 公司 的 复制 新 录像 的 详细 信息 VideoForRent (videoNo , available, catalogNo, branchNo) 

(j) 更 新 /删除 录像 拷贝 的 详细 信息 

(e) 输入 在 已 有 分 公司 中 登记 的 新 成 员 的 详细 信息 Member (memberNo, fName, IName, address) 

(k) 更 新 /删除 已 有 成 员 的 详细 信息 Registration (branchNo , memberNo , staffNo, dateJoined) 
外 键 memberNo 引 用 Member (memberNo) 

(f) 输入 某 成 员 租 用 录像 的 出 租 协议 的 详细 信息 RentalAgreement (rentalNo, dateOut, dateReturn， 





(1) 更 新 /删除 租用 录像 的 成 员 的 给 定 出 租 协议 的 详细 信息 memberNo, videoNo) 
从 这 个 分 析 可 以 看 出 ， 图 10-11 显 示 的 这 些 表 支 持 所 有 的 StayHome 的 Branch 用 户 视图 的 事务 
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表 10-2b) StayHome 的 Branch 视 图 的 查询 事务 所 需 的 表 





事 务 


需求 的 表 





(m) 列 出 在 给 定 城市 的 分 公司 的 详细 信息 


(n) 列 出 给 定 分 公司 中 的 员工 的 名 字 、 职务 和 工资 ， 按 


员工 名 字 排 序 
(o) 列 出 每 个 分 公司 经 理 的 名 字 ， 按 分 公司 号 排序 


(p) 列 出 某 具 体 分 公司 中 所 有 录像 的 题目 、 类 别 和 是 否 


可 获得 ， 按 种 类 排序 


(q) 列 出 某 一 具体 分 公司 中 对 所 给 定 的 演员 所 参加 演出 
的 所 有 录像 的 题目 、 类 别 和 是 否 可 获得 ， 按 题目 排序 


(D 列 出 某 一 具体 分 公司 中 对 于 所 给 出 的 导演 所 执导 的 


所 有 录像 的 题目 ， 类 别 和 是 否 可 获得 


(s) 列 出 具体 成 员 当前 正在 租用 的 所 有 录像 的 详细 信息 ， 


按 题目 排序 


(0 列 出 具体 分 公司 给 定 的 录像 拷贝 的 详细 信息 


Branch (branchNo, street, city, state, zipCode, 
mgrStaffNo) 。 

Telephone (telNo, branchNo) 

外 键 branchNo 引 用 Branch (branchNo) 

Staff (staffNo, name, position, salary, branchNo, 
supervisorStaffNo) 

Branch (branchNo, street, city state, zipCode, mgrStaffNo) 
外 键 mgrStaffNo 引 用 Staff (StaffNo) 

Staff (staffNo, name, position, salary, branchNo, 
supervisorStaffNo) 

Video (catalogNo, title, category, dailyRental, price, 
directorNo) 

VideoForRent (videoNo, available, catalogNo, 
branchNo) 

外 键 catalogNo 引 用 Video (catalogNo ) 








Actor (actorNo, actorName) 

Role (catalogNo, actorNo, character) 

外 键 catalogNo 引 用 Video (catalogNo) 

外 键 actorNo 引 用 Actor (actorNo) 

Video (catalogNo, title, category, dailyRental, price. 
directorNo) 

VideoForRent (videoNo, available, catalogNo, 
branchNo) 

外 键 catalogNo 引 用 Video (catalogNo) 

Director (directorNo, directorName) 





Video (catalogNo, title, category, dailyRental, price, 
directorNo) 

外 键 directorNo 引 用 Director (directorNo) 
VideoForRent (videoNo, available, catalogNo, 
branchNo) 

外 键 cataiogNo 引 用 Video (catalogNo) 

Video (catalogNo, title, category, dailyRental, price, 
directorNo) 

VideoForRent (videoNo, available, catalogNo, 
branchNo) 

外 键 catalogNo 引 用 Video (catalogNo) 
RentalAgreement (rentalNo, dateOut, dateReturn, 
memberNo, videoNo) 

外 键 videoNo 引 用 VideoForRent(VideoNo) 

外 键 memberNo 引 用 Member (memberNo) 

Member (memberNo , fName, IName, address) 

Video (catalogNo , title, category, dailyRental, price, 
directorNo) 

VideoForRent (VideoNo, available, catalogNo, 
branchNo) 

外 键 videoNo 引 用 VideoForRent (videoNo) 
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( 续 ) 





事务 需求 的 表 





(9) 列 出 某 一 类 别 中 所 有 录像 的 标题 、 按 标题 排序 Video (catalogNo, title, category, dailyRental, price, 


directorNo) 


(7 列 出 每 个 分 公司 中 每 个 类 别 中 录像 的 总 数 ， 按 分 公 Video (catalogNo, tie, category, dailyRental. price, directorNo) 








可 导 排 序 VideoForRent (videoNo, available, catalogNo, branchNo) 
外 键 catalogNo 引 用 Video (catalogNo) 
(w) 列 出 所 有 分 公司 录像 的 总 价值 Video (catalogNo, title, category, dailyRental, price, 





directorNo) 
VideoForRent (videoNo, available, catalogNo, branchNo) 
外 键 catalogNo 引 用 Video (catalogNo) 
(x) 列 出 每 个 演员 的 录像 总 数 ， 按 演员 的 名 称 排序 Video (catalogNo, title, category, dailyRental, price, 
directorNo) 
Role (catalogNo, actorNo, character) 
外 键 catalogNo 引 用 Video (catalogNo) 
外 键 actorNo 引 用 Actor (actorNo) 
Actor (actorNo, actorName) 
(y) 列 出 2002 年 加 入 每 个 分 公 本 的 成 员 的 总 数 ， 按 分 公司 Registration (branchNo , memberNo, staffNo, date.Joined) 











号 排序 
(2) 列 出 每 个 分 公司 录像 所 有 可 能 的 日 租金 ， 按 分 公司 号 Video (catalogNo, tite, category, dailyRental, Price, directorNo) 
排序 VideoForRent (videoNo, available, catalogNo, branchNo) 


外 键 catalogNo 引 用 Video (catalogNo) 


提示 与 上 一 阐 中 介绍 的 步骤 1.8 合 在 一 起 ， 这 看 起 来 似乎 是 一 件 很 困难 的 工作 ， 也 确 
实 是 这 样 。 因 此 ， 你 可 能 想 省 略 这 一 步 。 然 而 ， 现 在 做 这 些 检 查 要 比 将 来 在 数据 模型 
中 发 现 和 解决 错误 好 得 多 。 


10.1.4 步骤 2.4: 检查 业务 规则 


目标 ”检查 还 辑 数 据 库 设 计 中 表达 的 业务 规则 。 


业务 规则 是 用 于 防止 数据 库 不 完整 、 不 准确 或 不 一 致 的 约束 。 尽 管 DBMS 在 完整 性 方面 
的 控制 可 能 存在 也 可 能 不 存在 ， 但 这 不 是 问题 所 在 。 在 这 个 阶段 ， 你 只 关心 高 级 设计 ， 即 确 
定 需要 什么 样 的 数据 完整 性 约束 ， 而 不 管 怎样 去 实现 。 标 识 完 完整 性 约束 之 后 ， 就 可 以 得 到 
一 个 完整 而 准确 地 搞 述 视图 的 局 部 逻辑 数据 模型 。 如 果 必 要 的 话 ， 可 以 从 逐 辑 数据 模型 产生 
物理 数据 库 设计 ， 例 如 为 用 户 构建 系统 的 原型 ， 

我 们 考虑 下 面 五 种 类 型 的 完整 性 约束 : 

。 需要 的 数据 

* 列 的 值 域 约束 

*。 实体 完整 性 

。 多 样 性 

。 参 照 完整 性 

。 其 他 业务 规则 

1. 需要 的 数据 

茶 些 列 必 须要 包含 值 ， 换 旬 话 说 ， 它 们 不 允许 有 空 值 ( 空 值 的 定义 参见 2.3.1 季 )， 例 如 ， 
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每 个 成 员 必 须 有 一 个 工作 职位 (例如 经 理 和 监理 )。 当 在 步骤 1.3 中 将 列 ( 属 性) 存档 到 数据 
字典 中 时 ， 就 应 该 已 经 标识 了 这 些 约束 。 

2. 列 的 值 域 约束 

每 个 列 都 有 一 个 值 域 (一 组 对 该 列 合 法 的 值 )。 例 如 ， 员 工 中 一 个 成 员 的 职位 是 导演 、 经 
理 、 监 理 、 助 理 或 采购 员 ， 所 以 职位 (position) 这 一 列 的 值 域 就 由 并 且 仅 由 这 些 值 组 成 。 当 
在 步骤 1.4 中 为 数据 选择 列 (属性 ) 域 的 时 候 就 应 该 标识 约束 ( 域 的 定义 见 2.2.1 节 )。 

3. 实体 完整 性 

实体 的 主键 不 能 为 空 。 例 如 ，Staff 表 中 的 每 个 记录 的 主键 列 stafftNo 必 须 有 值 。 当 在 步骤 
1.5 为 每 个 实体 标识 主键 时 ， 这 些 约束 就 应 该 被 考虑 到 (实体 完整 性 定义 见 2.3.2 节 )。 

4. 多 样 性 

多 样 性 表达 了 数据 库 中 数据 间 的 关系 的 约束 。 例 如 ， 分 公司 必须 有 会 员 而 且 每 个 分 公司 
必需 要 有 员工 。 确 保 标 识 并 表达 了 所 有 合适 的 业务 规则 是 对 企业 数据 需求 进行 建 模 的 重要 方 
面 。 在 步骤 1.2 中 ， 我 们 定义 了 实体 间 的 关系 以 及 所 有 的 业务 规则 ， 可 以 按 这 种 方式 表达 的 业 
务 规 则 都 定义 在 这 个 步骤 的 文档 中 了 。 

5. 参照 完整 性 

外 键 包含 与 父 表 相 匹配 的 主键 值 ， 使 子 表 中 的 每 个 记录 与 父 表 中 的 记录 关系 起 来 。 参 照 
完整 性 (参照 完整 性 定义 见 2.3.3 节 ) 意味 着 ， 如 果 外 键 有 值 ， 则 这 个 值 必须 引用 父 表 中 存在 
的 记录 。 例 如 ， Staff 表 中 branchNo 列 将 员工 中 的 成 员 与 该 成 员 所 工作 的 Branch 表 的 记录 相关 
联 。 如 果 branchNo 列 非 空 ， 则 它 必 然 包 含 Branch 表 中 branchNo 列 的 一 个 已 存在 的 值 ， 否 则 该 
成 员 将 被 分 配 到 一 个 不 存在 的 分 公司 。 

关于 外 键 ， 有 两 点 必须 要 强调 。 

。 外 键 允 许 为 空 吗 ? 

例如 ， 对 员工 来 说 没有 分 公司 号 ， 那 么 还 能 够 保存 该 成 员 的 详细 信息 吗 ? 这 个 问题 并 不 
是 说 分 公司 号 是 否 存在 ， 而 是 说 分 公司 号 是 否 必须 要 被 指定 。 通 常 ， 如 果 关 系 中 的 子 表 是 强 
制 参与 的 ， 那 么 就 不 允许 为 空 。 另 一 方面 ， 如 果子 表 是 可 选 参与 的 ， 那 么 就 允许 为 空 。 

* 如何 保证 参照 完整 性 ? 

为 保证 参照 完整 性 ， 应 该 指定 存在 约束 (existence constraint) ， 该 约束 定义 了 主键 和 外 键 
在 什么 条 件 下 能 够 被 插入 、 更 新 或 删除 。 考 虑 1:* 关系 Branch Has Staff， Branch 表 的 主键 
branchNo 在 Staff 表 是 外 键 。 让 我 们 考虑 如 下 六 种 情况 。 

(1) 情况 1: 向 子 表 中 插入 记录 (Staff) 

为 了 保证 参照 完整 性 ， 检查 新 的 Staff 记 录 的 外 键 branchNo 是 为 空 还 是 为 一 个 Branch 表 中 
已 存在 的 记录 的 值 。 

(2) 情况 2: 从 子 表 中 删除 记录 (Staff) 

如 果子 表 的 一 个 记录 被 删除 ， 参 照 完整 性 不 受 影响 。 

(3) 情况 3: 更 新 子 表 记录 中 的 外 键 (Staff) 

这 与 情况 1 相似 。 为 了 保证 参照 完整 性 ， 检 查 被 更 新 的 Staff 记 录 的 外 键 列 (branchNo) 是 
置 为 空 值 还 是 置 为 Branch 记 录 中 已 存在 的 值 。 

(4) 情况 4: 向 父 表 中 插入 记录 (Branch) 

向 父 表 中 插入 记录 并 不 影响 参照 完整 性 ， 只 不 过 是 父亲 没有 孩子 一 换 句 话说 ， 就 是 一 个 
分 公司 没有 成 员 。 
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(5) 情况 5: 从 父 表 中 删除 记录 (Branch ) 

若 父 表 中 的 一 个 记录 被 删除 了 ， 如 果 有 一 个 子 记 录 引 用 这 个 被 删除 的 父 记录 ， 则 参照 完 
整 性 就 丢失 了 。 换 句 话说 ， 如 果 被 删除 的 分 公司 中 还 有 员工 在 其 中 工作 ， 则 就 失去 了 参照 完 
整 性 。 在 这 种 情况 下 ， 可 以 考虑 如 下 几 种 操作 : 

“NO ACTION (不 操作 ): 如 果 有 任何 相关 的 子 记录 ， 就 不 从 父 表 中 将 该 记录 删除 。 在 我 
们 的 例子 中 ,“ 如 果 当 前 还 有 成 员 在 工作 ， 则 不 能 删除 分 公司 ”。 

“CASCADE (级 联 ): 当 父 记录 被 删除 后 ， 自 动 删除 相关 的 子 记录 。 如 果 被 删除 的 子 记 
录 也 在 其 他 关系 中 充当 父 记录 ， 那 么 也 应 该 删除 那些 子 表 中 的 相关 记录 。 换 句 话说 ， 删 
除 从 父 表 级 联 到 子 表 。 在 我 们 的 例子 中 ,“ 删 除 一 个 分 公司 的 同时 ， 自 动 删 除 所 有 在 那 
个 公司 工作 的 成 员 。” 很 明显 ， 在 这 种 情况 下 ， 这 种 策略 并 不 明智 。 

"SET NULL ( 置 空 ): 当 父 记录 被 删除 的 时 候 ， 相 关子 记录 中 外 键 的 值 自动 被 置 为 空 值 。 
在 我 们 的 例子 中 ,“ 如 果 分 公司 被 删除 ， 表 明 原 来 在 那个 公司 工作 的 员工 现在 所 在 的 分 
公司 是 未 知 的 .” 正 如 步骤 1.3 中 定义 的 ， 仅 当 组 成 外 键 的 列 允 许 为 空 时 ， 才 可 以 考虑 这 
个 策略 。 

“SET DEFAULT ( 置 预定 值 ): 当 父 记录 被 删除 时 ， 所 有 相关 子 记录 中 的 外 码 的 值 自动 置 
为 他 们 的 预 置 值 。 在 我 们 的 例子 中 ,“ 如 果 分 公司 被 删除 ， 表 明 从 前 在 该 分 公司 工作 的 
员工 归属 为 男 一 个 (预定 的 ) 公司 .” 正 如 步骤 1.3 所 定义 的 ， 仅 当 组 成 外 键 的 列 有 预 置 
值 时 才 可 以 考虑 这 种 策略 。 





图 10-12 StayHome 的 Branch 视 图 的 表 的 参照 完整 性 约束 


“NO CHECK (不 检查 ): 当 父 记录 被 删除 时 ， 不 做 任何 保证 参照 完整 性 的 操作 。 这 种 策 
略 只 有 极端 的 情况 下 才 被 考虑 。 





156 。 蓝 三 高 分 还 秤 数据库 三 矿 


(6) 情况 6: 更 新 父 记录 的 主键 (Branch ) 

如 果 父 记录 的 主键 值 被 更 新 了 ， 若 有 子 记录 引用 此 主键 值 ， 则 失去 了 参照 完整 性 。 也 就 
是 说 ， 如 果 当 前 被 更 新 的 分 公司 有 员工 工作 ， 更 新 后 ， 员 工 工作 的 分 公司 与 实际 的 分 公司 将 
不 一 致 。 为 了 确保 参照 完整 性 ， 可 使 用 上 面 已 介绍 的 策略 。 在 CASCADE 情 况 中 ， 更 新 父 记录 
的 主键 的 同时 更 新 子 记录 ， 也 就 是 处 于 级 联 的 状态 下 。 

图 10-12 为 StayHome 的 Branch 视 图 创建 的 表 的 参照 完整 性 约束 。 

6. 其 他 业务 规则 

最 后 ， 考 虑 被 称 为 业务 规则 的 约束 。 更 新 实体 的 时 候 ， 可 能 会 被 现实 世界 的 事务 要 求 所 
约束 。 例 如 ，StayHome 有 这 样 的 业务 规则 ， 防 止 每 个 成 员 一 次 借 超过 10 盘 的 录像 。 

7. 将 所 有 完整 性 约束 存档 

在 数据 字典 中 将 所 有 的 完整 性 约束 存档 ， 以 作为 物理 数据 库 设计 阶段 的 参考 。 


10.1.5 步骤 2.5: 与 用 户 讨论 逻辑 数据 库 设计 


目标 。 确保 局 部 到 辑 数 据 模型 与 描述 模型 的 文档 确实 表达 了 用 户 视图 。 





此 视图 的 逻辑 数据 库 设计 应 该 已 经 设计 完全 ， 并 且 全 部 存档 。 但 在 完成 这 个 步 又 之 前 ， 
应 该 与 用 户 一 起 研究 这 个 设计 。 

如 果 设 计 只 有 一 个 用 户 视图 的 数据 库 ， 或 使 用 集中 化 方法 并 合并 了 多 个 用 户 视图 ， 那 么 
就 可 以 开始 物理 数据 库 的 设计 了 。 物 理 数 据 库 设计 在 第 12 章 到 第 16 章 描述 。 但 是 ， 如 果 是 设 
计 有 多 个 用 户 视图 的 复杂 的 数据 库 ， 并 且 使 用 视图 集成 方法 来 管理 这 些 用 户 视图 ， 则 在 进行 
物理 数据 库 设 计 之 前 应 先 阅读 附录 C。 


10.2 本 章 小 结 


* 逻辑 数据 库 设 计 步 又 2 的 主要 目的 是 为 ER 图 创建 表 并 检查 表 的 结构 。 

* 使 用 规范 化 方法 检查 表 的 结构 。 

“ 检查 表 结 构 以 确保 它们 支持 用 户 所 要 求 的 事务 。 

“业务 规则 可 以 防止 数据 库 不 完整 、 不 准确 和 不 一 致 。 这 些 规 则 包括 : 完整 性 约束 、 需 要 
的 数据 、 列 值 约束 、 实 体 完整 性 、 多 样 性 、 参 照 完整 性 和 其 他 的 业务 规则 。 

* 已 有 约束 通过 定义 条 件 确 保 了 参照 完整 性 ， 可 以 根据 这 些 条 件 插 人 、 更 新 和 删除 主键 或 
外 键 。 

“ 当 一 个 子 记 录 引 用 了 要 删除 /更 新 的 父 记录 时 ， 可 以 考虑 使 用 如 下 几 种 策略 : NO 
ACTIION、CASCADE、SET NULL、SET DEFAULT 和 NO CHECK。 


复习 题 


10.1 描述 逻辑 数据 库 设计 方法 学 步骤 2 的 主要 目的 和 任务 。 
10.2 描述 下 述 情况 创建 表 的 规则 : 

(a) 强 实体 和 弱 实体 

(b) 一 对 多 (1:*) 二 元 关系 

(0) 一 对 多 (1:*) 递归 关系 
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(d) 一 对 一 (1:1) 二 元 关系 
(e) 一 对 一 (11) 递归 关系 
(f) 多 对 多 (*:*) 二 元 关系 
(g) 复杂 关系 
(h) 多 值 属性 


给 出 能 够 说 明 你 的 答案 的 例子 。 


10.3 
10.4 
10.5 
10.6 


练习 


10.7 


讨论 如 何 应 用 规范 化 技术 检查 从 ER 图 创建 的 表 的 结构 以 及 支持 的 文档 。 

讨论 可 以 用 于 检查 表 是 否 支持 用 户 需 要 的 事务 的 一 个 方法 。 

讨论 业务 规则 的 含义 ， 给 出 能 够 说 明 你 的 答案 的 例子 。 

如 果 有 一 个 子 记 录 引 用 了 一 个 我 们 将 要 删除 的 父 记录 ， 描 述 一 个 可 以 应 用 的 备用 策略 。 


为 附录 E 中 给 出 的 每 个 BR 图 创建 表 的 描述 ， 在 创建 时 首先 不 要 看 答案 中 的 表 描 述 。 
比较 你 的 表 和 答案 中 的 表 ， 并 说 明 有 何不 同 。 
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本 章 主 题 : 

。 基本 ER 建 模 概念 的 限制 和 使 用 增强 的 数据 建 模 概 念 创建 更 复杂 应 用 的 需求 。 

* 与 增强 的 实体 一 关系 模型 (EER) 相关 的 主要 概念 叫做 特 化 / 泛 化 。 

* 在 EER 模 型 中 显示 特 化 / 泛 化 的 图 表 技 术 。 

。 在 EER 模 型 中 怎样 创建 代表 特 化 / 泛 化 的 表 。 

在 第 7 章 中 ， 我 们 介绍 了 与 实体 - 关系 (ER) 建 模 相 关 的 基本 概念 ， 并 在 第 9 章 和 第 10 章 
介绍 的 逻辑 数据 库 设 计 方 法 学 中 使 用 了 这 些 概念 来 构建 ER 模型 。 这 些 基 本 概念 对 于 表达 传统 
的 基于 管理 的 数据 库 应 用 的 数据 模型 通常 是 够 用 的 。 然 而 ， 对 于 更 复杂 的 数据 库 应 用 ， 这 些 
基本 的 ER 概念 就 有 限 了 。 这 就 需要 开发 具有 附加 “语义 ”的 建 模 概念 。 具有 附加 语义 概念 的 
ER 模型 就 是 增强 的 实体 -关系 模型 (Enhanced Entity-Relationship，EER )。 在 本 章 中 ， 我 们 
介绍 了 与 EER 模 型 有 关 的 最 有 用 的 概念 之 一 -， 叫做 特 化 /证 化 (Specialization/Generalization ) ， 
并 且说 明了 如 何 使 用 它 (方法 学 概要 见 附录 B )。 

本 书 中 所 介绍 的 数据 库 设 计 方 法 学 在 步骤 1.6 中 提供 了 使 用 EER 模 型 的 附加 概念 的 选择 。 | 
是 否 使 用 这 个 步 允 ， 依 赖 于 用 户 需求 (或 部 分 用 户 需求 ) 的 复杂 性 ， 同时 ， 使 用 附加 的 建 模 
概念 有 帮 于 数据 库 设计 过 程 。 


11.1 特 化 / 泛 化 


特 化 / 泛 化 的 概念 是 与 称 为 超 类 和 子 类 的 特定 类 型 的 实体 以 及 属性 继承 ( Attribute 
Inheritance) 的 过 程 有 关 的 。 本 节 我 们 以 定义 超 类 和 子 类 并 检查 超 类 / 子 类 的 关系 开始 。 我 们 
描述 了 属性 继承 过 程 并 比较 特 化 和 泛 化 过 程 。 我 们 也 介绍 怎样 使 用 UML( 统 一 建 模 语言 ) 符 号 
表达 特 化 / 泛 化 。 


11.1.1 超 类 和 子 类 


超 类 (Superclass) ”是 一 个 实体 ， 包 含 所 有 在 实 人 中 出 现 的 公共 属性 和 关系 


于 类 (Subclass) 是 一 个 实体 ， 有 一 个 区 分 的 角色 ， 并 且 包 含 在 ( 超 类 ) 实体 中 出 现 
的 部 分 具体 属性 和 关系 。 


通常 一 个 称 为 超 类 的 实体 包括 很 多 更 具体 的 称 为 子 类 的 实体 。 例如 ，Staff 就 是 一 个 具有 许多 
不 同 子 类 的 实体 。 Staff 实 体 的 成 员 的 实体 可 以 被 划分 为 Manager (经 理 )、Secretary (秘书 ) 和 
SalesPersonnel (销售 人 员 )。 换 句 话 说 ， Staff 实 体 是 子 类 Manager、 Secretary 和 SalesPersonnel 的 超 类 。 


11.1.2 超 类 / 子 类 关系 
在 一 个 超 类 和 它 的 任 一 个 子 类 之 间 的 关系 均 是 1:1 关 系 (1:1 关 系 在 5.5.1 节 定义 )， 被 称 为 


超 类 / 子 类 关系 。 例 如 ，Staff/Manager 构 成 了 一 个 超 类 / 子 类 关系 ， 子 类 的 每 个 成 员 也 是 超 类 的 
成 员 ， 但 是 有 一 个 唯一 的 角色 。 
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我 们 可 以 使 用 超 类 和 子 类 来 避免 在 一 个 实体 中 用 不 同 的 属性 来 描述 实体 。 例 如 ， 
SalesPersonnel 可 能 有 特殊 属性 ， 如 salesArea 和 carAllowance， 等 等 。 如 果 所 有 的 Staff 的 公用 
属性 和 那些 某 个 特殊 工作 要 求 的 具体 属性 都 由 实体 Staff 代 表 ， 那 么 对 于 某 些 特殊 工作 的 属性 
就 会 产生 许多 空 值 。 很 明显 ， 销 售 人 员 有 和 其 他 员工 共同 的 属性 ， 包 括 staffNo、name、 
position 和 salary， 但 也 有 不 共享 的 属性 。 如 果 我 们 要 在 一 个 实体 中 描述 员工 的 所 有 成 员 ， 这 
些 不 公用 的 属性 就 会 产生 问题 。 定 义 超 类 / 子 类 能 让 我 们 描述 只 和 Staff 具 体 子 类 相关 ， 但 并 不 
与 Staff 全 部 相关 的 关系 。 例 如 ， 销 售 人 员 有 特殊 的 关系 ， 这 个 关系 并 不 是 对 所 有 员工 都 是 适 
用 的 ， 如 SalesPersonnel Requires Car( 销 售 人 员 需 要 汽车 )。 

为 了 说 明 上 面 所 提 到 的 问题 ， 让 我 们 考虑 图 11-1 中 叫做 AllStaff 的 表 。 这 张 表 包 含 职员 中 
所 有 成 员 的 详细 信息 ， 不 管 他 们 是 什么 职位 。 将 所 有 员工 的 详细 信息 放 在 一 张 表 中 的 结果 时 ， 
当 填 入 适合 于 所 有 员工 的 列 ( 即 staffNo、name、position、salary 和 branchNo) 时 ， 那些 只 对 
某 些 工作 角色 可 用 的 列 只 被 填 人 了 部 分 值 。 例 如 ， 与 SalesPersonnel 子 类 相关 的 列 ( 即 
salesArea、vehLicenseNo 和 carAllowance) 对 不 在 该 子 类 中 的 员工 的 其 他 成 员 都 没有 值 。 


对 所 有 职员 均 有 效 的 列 对 销售 人 员 均 有 效 的 列 





图 11-1 包含 员工 中 所 有 成 员 的 详细 信息 的 AllStaff 表 










将 超 类 和 子 类 引入 ER 模型 有 两 个 重要 的 原因 。 第 一 个 原因 是 ， 避免 多 次 描述 相近 的 概念 ， 
因此 可 以 节省 时 间 ， 并 使 ER 模型 的 可 读 性 更 强 。 第 二 个 原因 是 ， 在 设计 中 增加 了 更 多 人 们 较 
热 悉 的 语义 信息 。 例 如 ， 断 言 Manager IS-A member of staff (经 理 是 员工 中 的 一 个 成 员 ) 和 van 
ISA typeofvehicle ( 运 贷 车 是 车 辆 的 一 种 . ) 将 重要 的 语义 内 容 以 一 种 简单 易 懂 的 形式 表达 出 来 。 


11.1.3 属性 继承 







正如 上 面 所 提 到 的 ， 子 类 中 的 实体 代表 超 类 中 的 相同 的 “现实 世界 ”对 象 。 因 此 ， 子 类 
的 一 个 成 员 继承 了 与 超 类 有 关 的 属性 ， 但 也 可 以 有 此 子 类 的 特定 属性 。 例 如 ，SalesPersonnel 
子 类 的 成 员 有 子 类 特定 的 属性 ， 即 SsalesArea、 vehLicenseNo 和 carAllowance， 以 及 Staff 超 类 的 
所 有 属性 ， 即 staffNo、name、 position 、salary 和 branchNo。 

子 类 是 有 自己 的 权限 的 实体 ， 它 可 以 有 一 个 或 多 个 子 类 。 有 多 个 超 类 的 子 类 称 为 共享 子 
类 (shared subclass ) 。 换 句 话说 ， 共享 子 类 的 成 员 一 定 是 相关 超 类 的 成 员 。 其 结果 是 ， 超 类 
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的 属性 由 共享 的 子 类 继承 ， 而 共享 子 类 也 可 能 有 自己 的 附加 属性 。 这 个 过 程 也 就 是 多 重 继承 。 
实体 以 及 它 的 子 类 和 它 的 子 类 的 子 类 等 等 ， 被 称 为 类 型 层次 (type hierarchy )。 类 型 
层次 有 不 同 的 名 称 ， 包 括 特 化 层次 (specialization hierarchy)、 泛 化 层次 generalization 
hierarchy) 和 IS-A 层 次 (例如 Manager IS-A (member of ) Staff)。 例 如 ，Manager 是 Staff 
的 特 化 ，Sta 作 是 Manager 的 泛 化 。 在 接 下 来 的 内 容 中 ， 我 们 描述 特 化 和 泛 化 的 过 程 。 







11.1.4 特 化 过 程 


特 化 (Specialization) 通过 标识 用 来 区 分 实体 间 成 员 的 特征 来 最 大 化 实体 间 成 员 的 盖 


别 的 过 程 。 





特 化 是 一 个 自 顶 向 下 的 方法 ， 它 定义 超 类 集合 以 及 有 关 的 子 类 。 这 些 子 类 集合 的 定义 基 
于 超 类 中 实体 的 一 些 特 别 特征 。 当 我 们 标识 实体 的 一 个 子 类 时 ， 我 们 把 特殊 的 属性 与 子 类 相 
关联 (在 必要 时 )， 并 且 标 识 出 子 类 和 其 他 实体 或 子 类 〈 必 要 时 ) 之 间 的 关系 。 


11.1.5 泛 化 过 程 


泛 化 (Generalization) 通过 标识 实体 间 的 公共 特征 来 最 小 化 实体 间 差 别 的 过 程 。 





泛 化 过 程 是 一 个 自 底 向 上 的 方法 ， 它 从 初始 的 子 类 中 产生 泛 化 的 超 类 。 泛 化 过 程 可 以 被 
看 成 是 特 化 过 程 的 逆 过 程 。 例 如 ， 考 虑 下面 的 模型 ， 其 中 Manager、Secretary 和 
SalesPersonnel 代 表 不 同 的 实体 。 如 果 在 这 些 实体 上 应 用 泛 化 过 程 ， 我 们 要 标识 出 它们 之 间 的 
相似 之 处 ， 如 公共 的 属性 和 关系 。 正 如 前 面 所 说 的 ， 这 些 实体 分 享 对 所 有 员工 来 说 公共 的 属 
性 ， 因 此 我 们 将 Manager、Secretary 和 SalesPersonnel 标 识 为 泛 化 超 类 Staff 的 子 类 。 

图 表 描 述 

UML 对 子 类 和 超 类 有 特定 的 符号 。 例 如 ， 将 Staff 实 体 的 特 化 /证 化 看 成 代表 工作 角色 的 子 
类 。Staff 超 类 和 Manager、Secretary 和 SalesPersonnel 子 类 可 以 用 图 11-2 所 示 的 EER 模 型 来 图 解 
的 描述 。 注 意 Staff 超 类 和 子 类 ， 作 为 实体 ， 它 们 以 长 方形 表示 。 特 化 / 泛 化 子 类 由 带 篆 头 的 线 
关系 ， 稍 头 指 向 超 类 。 稍 头 下 面 的 标签 {Optional, And} ( {可 选 ， 与 })， 描 述 了 特 化 / 泛 化 关系 
的 约束 。 这 些 约束 在 接 下 来 的 内 容 中 将 更 详细 地 介绍 。 、 

给 定子 类 的 特定 属性 列 在 代表 子 类 的 方 框 的 下 部 。 例 如 ，salesArea、vehLicenseNo 和 
carAllowance 属 性 只 与 子 类 SalesPersonnel 相 关 ， 并 且 对 于 子 类 Manager 或 Secretary 是 无 效 的 。 
类 似 的 情况 下 ， 对 子 类 Manager， 属 性 bonus (红利 ) 是 特定 的 ; 而 对 子 类 Secretary ， 属 性 
typingSpeed (打字 速度 ) 是 特定 的 。 

图 11-2 也 说 明了 适用 于 特定 子 类 或 仅 适 用 于 超 类 的 关系 。 例 如 ， 子 类 Manager 通 过 
Manages 关 系 与 Branch 实 体 关 联 ， 而 Staff 实 体 通 过 Has 关 系 与 Branch 实 体 关 联 。 


注意 Manages 关 系 中 Manager 的 多 样 性 是 1:1， 而 以 前 Manages 关 系 中 的 Staff 的 多 样 性 是 
0:1 ( 换 句 话说 ，Manager 具 有 强制 参与 ， 而 Staff 为 可 选 参 与 )。 


在 图 11-3 中 ，Staff 特 化 / 泛 化 被 扩展 为 一 个 共享 的 叫做 SalesManager 的 子 类 和 一 个 叫做 
Secretary 的 超 类 ， 而 Secretary 又 有 自己 的 叫做 AssistantSecretary 的 子 类 。 换 句 话 说， 共享 子 类 





肿 117 音 席 级 建 模 投 大 161 


























branchNo {PK} staffNo {PK} 
street name 

city position 
state salary 


zipCode 







无 连接 约 
{Optional, And} 无 连接 约束 


Secretary 

















SalesArea 
vehLicenseNo 
carAllowance 
















branchNo {pK} staffNo {PK} 


street name 
dty position 
state salary 











salesArea 
vehLicenseNo 
CarAllowance 


V {Optional} A 


图 11-3 Staff 实 体 的 特 化 / 泛 化 ， 它 包括 SalesManager 共 享 子 类 和 AssistantSecretary 子 类 ， 
此 子 类 有 自己 的 Secretary 子 类 










{Optional) 









AssistantSecretary 








SalesManager 的 成 员 必 须 是 SalesPersonnel 和 Manager 子 类 以 及 Staff 超 类 的 成 员 。 结果 是 ，Staff 
超 类 的 属性 (staffNo、name、position、 salary ) 、 SalesPersonnel 子 类 的 属性 (salesArea、 
vehLicenseNo、carAllowance ) 和 Manager(bonus) 被 子 类 SalesManager 继 承 ， 而 SalesManager 
也 有 其 自身 的 属性 ， 称 为 salesTarget( 销 售 是 标 )。 

AssistantSecretary 是 Secretary 的 子 类 ， 而 Secretary 又 是 Staff 的 子 类 。 这 意味 着 
AssistantSecretary 的 成 员 必 须 是 Secretary 子 类 和 Staff 超 类 的 成 员 。 结 果 ， AssistantSecretary 子 
类 继承 了 Staff 超 类 (staffNo, name，position， salary ) 的 属性 和 Secretary 子 类 (typingSpeed ) 
的 属性 ， 同 时 它 还 可 以 有 自己 的 属性 startDate。 


11.1.6 超 类 / 子 类 关系 的 约束 


在 超 类 / 子 类 关系 可 以 使 用 两 类 约束 ， 分 别 为 参与 (participation) 约束 和 无 连接 (disjoint) 约束 。 
1. 参与 约束 


参与 约束 (Participation Constraint) 决定 在 超 类 中 的 每 次 出 现 是 否 必 须 作 为 子 类 的 一 个 成 员 。 





参与 约束 可 以 是 强制 的 也 可 以 是 可 选 的 。 有 强制 参与 的 超 类 / 子 类 关系 指明 超 类 中 出 现 的 
每 个 实体 必须 也 是 子 类 的 成 员 。 为 了 表达 强制 参与 ，Mandatory (强制 ) 放置 在 指向 超 类 的 三 
角 下 的 花 括 号 中 。 例 如 ， 图 11-4 中 的 Vehicle (车 辆 ) 特 化 / 泛 化 (Van、Bus 和 Car) (货运 车 ， 
公共 汽车 和 小 轿车 ) 有 强制 参与 ， 这 意味 着 每 辆 车 都 必须 是 货运 车 、 公 共 汽 车 或 小 轿车 。 


ET 


vehLicenseNo {PK} 





图 11-4 将 实体 Vehicle 特 化 / 泛 化 为 vehicle (车 辆 ) 类 型 


可 选 参 与 的 超 类 / 子 类 关系 明确 指明 超 类 的 成 员 不 需要 属于 任何 子 类 。 为 了 表达 可 选 参 与 ， 
Optional (可 选 ) 放置 在 指向 超 类 的 三 角 下 的 花 括号 中 。 例 如 ， 在 图 11-2 中 ， 工 作 角 色 特 化 / 泛 
化 为 可 选 参与 ， 这 意味 着 员工 的 成 员 不 需 有 附加 的 工作 角色 ， 如 Manager、Secretary 或 者 
SalesPersonnel ( 经理、 秘书 或 者 销售 人 员 )。 

2. 无 连接 约束 


无 连接 约束 (Disjoint Constraint) ”描述 子 类 成 员 之 间 的 关系 ， 并 且 表 明 超 类 的 成 员 是 





否 可 能 是 一 个 或 多 个 子 类 的 成 员 。 
只 有 当 超 类 有 多 个 子 类 的 时 候 ， 才 应 用 无 连接 约束 。 如 果子 类 是 无 连接 的 ， 那 么 实体 只 





芒 11 章 离 级 建 檬 插 术 163 


能 是 一 个 子 类 的 成 员 。 为 了 表示 无 连接 超 类 / 子 类 关系 ，Or( 或 ) 放 置 在 花 括号 中 参与 约束 的 旁 
边 。 例 如 ， 图 11-4 中 ，Vehicle 的 特 化 / 泛 化 (Van、Bus 和 Car) 是 无 连接 的 ， 这 意味 着 车 辆 是 
货运 车 、 公 共 汽 车 或 小 轿车 。 

如 果 一 个 特 化 /证 化 的 子 类 不 是 无 连接 的 ( 称 为 非 无 连接 )， 那么 ， 实 体 的 出 现 可 能 是 多 个 
子 类 的 成 员 。 为 了 表达 非 无 连接 超 类 / 子 类 关系 ， And( 与 ) 放 置 在 花 括 号 中 参与 约束 的 旁边 。 例 
如 ， 图 11-2 (和 图 11-3 中 )， 工作 角色 的 特 化 / 泛 化 的 子 类 (Manager Secretary. 
SalesPersonnel) 是 非 无 连接 的 ， 这 意味 着 实体 的 出 现 既 可 以 是 Manager 子 类 的 成 员 ， 又 可 以 
是 SalesPersonnel 子 类 的 成 员 。 共享 子 类 SalesManager 的 出 现 也 证 实 了 这 一 点 。 

特 化 / 泛 化 的 参与 和 无 连接 约束 分 为 四 类 : 强制 的 和 非 无 连接 的 、 可 选 的 和 非 无 连接 的 、 
强制 的 和 无 连接 的 、 可 选 的 和 无 连接 的 。 


11.2 创建 表达 特 化 / 泛 化 的 表 


在 第 10 章 ， 我 们 描述 了 如 何 使 用 ER 模型 基本 概念 从 数据 模型 创建 表 。 在 这 一 节 中 ， 我们 
说 明 如 何 为 特 化 /证 化 集合 创建 表 。 我 们 在 图 11-2 和 11-4 中 说 明 这 个 EER 模 型 的 过 程 。 同 从 前 
一 样 ， 我 们 用 关系 数据 库 的 数据 库 定义 语言 (DBDL) 来 描述 每 个 表 。 
对 EER 模 型 中 的 每 个 超 类 / 子 类 关系 ， 标 识 超 类 为 父 实体 ， 子 类 为 子 实体 。 关 于 如 何 将 关 
系 最 好 地 描述 为 一 个 或 多 个 表 ， 有 不 同 的 选择 。 最 正确 的 选择 依赖 于 表 11-1 所 示 的 超 类 / 子 类 
关系 的 参与 和 无 连接 约束 。 
表 11-1 表达 基于 参与 和 无 连接 约束 的 超 类 / 子 类 关系 的 选择 


部 分 约束 无 连接 约束 必需 的 表 
强制 非 无 连接 { 与 单 表 
可 先 非 无 连接 { 与 两 张 表 : 一 张 表 用 于 超 类 
一 张 表 用 于 所 有 子 类 
强制 无 连接 {或 ) 许多 表 : 一 张 表 用 于 每 个 连接 的 超 类 / 子 关 
可 选 无 连接 { 或 ; 许多 表 : 一 张 表 用 于 超 类 
共 他 表 对 应 每 个 子 类 


我 们 用 图 11-2 的 Staff 特 化 /汉化 作为 我 们 的 第 一 个 例子 。 Staff 超 类 和 它 的 子 类 (Manager、 
SalesPersonnel 或 Secretary ) 的 关系 是 可 选 的 ， 作为 Staff 的 成 员 可 以 不 属于 任何 一 个 子 类 (是 
非 无 连接 的 )， 也 可 以 属于 多 个 子 类 。 基于 表 11-1 中 所 给 出 的 选择 ， 应 该 为 超 类 建 一 张 表 ， 为 
所 有 的 子 类 建 一 张 表 ， 来 代表 Staff 超 类 / 子 类 关系 ， 如 图 11-5 所 示 ， 为 了 清楚 起 见 ， 我 们 也 采 
用 一 张 表 来 代表 Branch 实 体 和 它 与 Staff 的 关系 。 

我 们 使 用 图 11-4 中 的 Vehicle 特 化 / 泛 化 作为 我 们 的 第 二 个 例子 。 Vehicle 超 类 和 它 的 子 类 
(Van、Bus 或 Car) 的 关系 是 强制 的 ， Vehicle 超 类 的 所 有 成 员 必 须 属 于 子 类 中 的 一 个 (是 无 连 
接 的 )， 而 作为 Vehicle 超 类 的 一 个 成 员 则 可 以 只 属于 一 个 子 类 . 基于 表 11-1 中 所 给 出 的 选项 ， 
应 该 为 每 个 连接 的 超 类 / 子 类 建 一 张 表 来 代表 Vehicle 超 类 / 子 类 关系 ， 如 图 11-6 中 所 示 。 

尽管 表 11-1 中 的 选项 对 如 何 表达 超 类 / 子 类 关系 提供 了 -_ 些 较 好 的 指导 ， 但 还 有 其 他 的 因 
素 可 能 影响 最 终 的 选择 : 

* 子 类 是 否 包含 在 不 同 的 关系 中 。 

“ 每 个 子 类 不 同属 性 的 数目 。 

。 由 超 类 和 每 个 子 类 代表 的 实体 出 现 的 相对 数 目 。 
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图 11-6 代表 图 11-4 所 示 的 Vehicle 特 化 /证 化 的 表 


11.3 本 章 小 结 


“ 超 类 是 一 个 实体 ， 包 含 在 实体 中 出 现 的 所 有 公共 的 属性 和 关系 。 

“ 子 类 是 一 个 实体 ， 有 唯一 的 角色 ， 并 且 包 含 在 〈 子 类 ) 实体 中 出 现 的 某 些 属性 和 关系 。 
“属性 继承 是 这 样 一 个 过 程 ， 在 这 种 情形 中 ， 子 类 的 成 员 可 以 处 理子 类 特有 的 属性 ， 并 且 
继承 这 些 与 超 类 有 关 的 属性 。 

* 特 化 是 一 个 过 程 ， 它 通过 标识 实体 成 员 间 的 不 同 特征 来 最 大 化 它们 的 差别 。 

“汉化 是 一 个 过 程 ， 它 通过 标识 实体 的 共有 特征 来 最 小 化 它们 的 差别 。 

“在 超 类 / 子 类 关系 上 可 以 使 用 两 类 约束 ， 分 别 为 参与 约束 和 无 连接 约束 。 

“参与 约束 决定 在 超 类 中 的 每 个 出 现 是 否 必须 作为 子 类 的 一 个 成 员 。 

“无 连接 约束 描述 子 类 成 员 之 间 的 关系 ， 并 且 表 明 超 类 的 成 员 是 否 可 以 是 一 个 或 多 个 子 类 
的 成 员 。 


复习 题 


11.1 描述 超 类 和 子 类 代表 什么 ? 

11.2 描述 超 类 和 子 类 间 的 关系 。 

11.3 描述 并 用 一 个 例子 说 明 属性 的 继承 过 程 。 

11.4 将 超 类 和 子 类 的 概念 引入 EER 模 型 的 主要 原因 是 什么 ? 
11.5 描述 共享 的 子 类 代表 什么 ? 








11.6 
11.7 


练习 


11.8 
11.9 
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描述 并 对 比特 化 和 泛 化 的 过 程 。 
描述 应 用 在 特 化 和 泛 化 关系 上 的 两 个 主要 约束 。 


检查 特 化 /证 化 是 如 何在 附录 E 中 描述 的 某 些 案例 研究 中 应 用 的 。 
考虑 对 于 练习 7.12 中 描述 的 案例 研究 ， 在 ER 模型 中 引入 增强 的 特 化 /证 化 概念 是 否 
合适 。 如 果 合 适 ， 用 增强 的 概念 重 画 这 个 ER 图 为 ERR 图 。 





第 12 章 物理 数据 库 设计 一 一 步 又 3 
第 13 章 物理 数据 库 设 计 一 一 步骤 4 
第 14 章 物理 数据 库 设计 一 一 步骤 5 和 步骤 6 
第 15 章 物理 数据 库 设计 一 一 步骤 7 
第 16 章 :物理 数据 库 设计 一 一 步骤 8 


第 12 章 物理 数据 库 设计 一 一 步骤 3 


本 章 主 题 : 

。 物 理 数 据 库 设计 的 目的 。 

* 如 何 把 逻辑 数据 库 设 计 映 射 为 物理 数据 库 设 计 。 

。 如 何 为 目标 DBMS 设 计 基 本 表 。 

。 如 何 设计 派生 数据 的 表示 。 

。 如 何 为 目标 DBMS 设 计 业 务 规则 。 

在 本 章 和 接 下 来 的 几 章 中 ,我 们 通过 一 个 例子 描述 并 说 明 关系 数据 库 的 物理 数据 库 设 计 
方法 。 本 章 从 逻 辑 数 据 模型 以 及 描述 方法 学 中 步 又 1~3i( 步 又 1~3 在 第 9 章 ~ 第 10 章 介绍 ) 所 建 
模型 的 文档 开始 。 方法 学 开始 于 步 又 1 所 创建 的 逻辑 数据 模型 ， 接 下 来 在 步骤 2 中 使 用 这 些 逻 
辑 模型 派生 一 组 表 。 检查 逻辑 模型 和 派生 的 表 以 确保 它们 是 使 用 规范 化 技术 正确 创建 的 ， 并 
保证 它们 支持 用 户 所 需 的 事务 。 

在 数据 库 设 计 方 法 学 的 第 二 个 阶段 ， 也 就 是 物理 数据 库 设计 阶段 ， 必 须 确 定 如 何 将 逻辑 
数据 库 结构 (也 就 是 实体 、 属 性 、 关 系 和 约束 ) 转换 为 目标 DBMS 可 以 实现 的 物理 数据 库 设 
计 。 因 为 物理 数据 库 设 计 的 许多 方面 都 高 度 地 依赖 于 目标 DBMS ， 你 可 能 会 发 现 不 只 有 一 种 
方法 可 以 实现 数据 库 中 指定 的 部 分 。 因 此 为 了 正确 地 完成 这 项 工作 ， 需 要 具有 对 目标 DBMS 
功能 的 全 面 的 认识 ， 并 且 需 要 理解 特定 实现 细节 的 每 个 可 供 选 择 方案 的 优点 和 缺点 。 对 某 些 
系统 来 说 ， 考 虑 到 数据 库 的 使 用 目的 ， 可 能 还 需要 选择 合适 的 存储 策略 。PC RDBMS ， 例 如 
Microsoft Access， 通 常 有 固定 的 存储 结构 ， 因 此 ， 如 果 使 用 这 样 的 系统 ， 就 不 必 考 虑 这 一 步 。 

在 本 章 中 ， 我 们 介绍 如 何 将 从 逻辑 数据 模型 派生 来 的 表 转 化 成 具体 的 数据 库 实现 。 在 第 
13 章 中 ， 我 们 将 介绍 为 基本 表 选 择 文件 组 织 方式 以 及 确定 何 时 创建 索引 的 方针 。 在 第 14 章 ， 
我 们 将 讨论 在 创建 用 户 视图 过 程 中 确保 数据 库 安 全 的 方法 以 及 合适 的 数据 库 安 全 机 制 。 在 第 
15 章 中 ， 我 们 给 出 当 反 规范 化 物理 数据 模型 并 引入 宛 余 以 提高 性 能 的 一 些 指导 。 最 后 在 第 16 
章 中 , 我 们 将 讨论 监视 并 调整 操作 系统 的 过 程 。 
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尽管 在 后 续 的 章节 中 ， 我 们 将 介绍 物理 实现 细节 来 使 讨论 更 清楚 ， 为 了 说 明 各 DBMS 之 
间 的 差别 ， 我 们 将 使 用 Microsoft Access 来 演示 StayHome 示 例 的 实现 细节 。 为 了 对 照 ， 在 第 18 
章 、 第 19 章 用 到 的 第 二 个 例子 将 使 用 Oracle DBMS 。 

在 介绍 物理 数据 库 设计 方法 学 之 前 ， 我 们 先 简要 地 介绍 一 下 设计 过 程 。 


12.1 逻辑 与 物理 数据 库 设 计 的 比较 


逻辑 数据 库 设计 极 大 地 独立 于 实现 细节 ， 例 如 目标 DBMS 的 具体 功能 、 应 用 程序 、 编 程 
语言 或 者 任何 其 他 的 物理 考虑 。 逻 辑 数据 库 设 计 的 输出 是 一 个 逻辑 数据 模型 ， 此 模型 包括 描 
述 此 模型 的 文档 和 一 组 关系 表 ， 例 如 数据 字典 。 同 时 ， 这 些 也 代表 着 物理 设计 过 程 的 使 用 的 
信息 产 ， 并 且 它 们 提供 了 要 进行 有 效 的 数据 库 设计 非常 重要 的 依据 。 

逻辑 数据 库 设 计 关 心 的 是 “什么 "， 而 物理 数据 库 设 计 关心 的 是 “怎么 ”"。 特 别 是 作为 物 
理 数据 库 设 计 者 ， 必 须知 道 支持 DBMS 的 计算 机 系统 怎样 运行 ， 并 且 必 须要 有 对 目标 DBMS 功 
能 的 整体 认识 。 因 为 当前 系统 所 提供 的 功能 变化 范围 很 大 ， 因 此 物理 设计 必须 依赖 于 具体 的 
DBMS 系 统 。 但 是 ， 物 理 数据 库 设计 并 不 是 独立 的 行为 一 一 在 物理 、 逻 辑 和 应 用 设计 之 间 经 常 
是 有 反复 的 。 例 如 ， 在 物理 设计 期 间 为 了 改善 系统 性 能 而 进行 的 决策 ， 如 合并 表 ， 可 能 影响 
逻辑 数据 模型 (应 用 设计 的 讨论 见 4.9 节 )。 


12.2 物理 数据 库 设计 方法 学 概述 


物理 数据 库 设 计 (Physical Database Design) ”产生 辅 存 上 的 数据 库 实 现 的 描述 的 过 程 ， 


它 描述 了 基本 表 、 文 件 组 织 方式 和 用 于 实现 数据 有 效 访问 的 索引 以 及 任何 相关 的 完整 
性 约束 和 安全 限制 。 





物理 数据 库 设计 的 步骤 如 图 12-1 所 示 。 我 们 将 物理 数据 库 设 计 方 法 分 为 6 个 主要 步骤 ， 接 
着 逻辑 数据 库 设计 方法 的 两 个 步骤 ， 从 步骤 3 开始 ， 右 边 的 列 列 出 了 讨论 这 个 步骤 的 章 。 


步骤 3: 为 目标 DBMS 转 换 全 局 逻辑 数据 模型 
步骤 3.1: 设计 基本 表 
步 又 3.2: 设计 派生 数据 的 表示 
步 又 3.3: 设计 其 他 业务 规则 
: 选择 文件 组 织 方式 和 索引 
步 难 4.1: 分 析 事 务 


步骤 4.2: 选择 文件 组 织 方式 
步 具 4.3: 选择 索引 
设计 用 户 视图 
: 设计 安全 性 机 制 
: 引入 受 控 元 余 的 考虑 
监视 并 调整 操作 系统 





图 12-1 物理 数据 库 设 计 方 法 学 中 的 步骤 
物理 数据 库 设 计 的 步骤 3 包括 使 用 从 目 标 DBMS 可 获得 的 功能 设计 基本 表 和 完整 性 约束 。 
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这 步 也 考虑 如 何 表达 模型 中 的 派生 数据 和 有 关 的 业务 规则 。 

步 允 4 包 括 分 析 必 须 支 持 的 事务 ， 并 基于 这 个 分 析 为 基本 表 选 择 文件 组 织 方 式 和 索引 。 
典型 情况 下 ，PC DBMS 有 固定 的 存储 结构 ， 但 其 他 的 DBMS 会 为 数据 提供 一 些 可 选择 的 文件 
组 织 方 式 。 从 用 户 的 观点 来 看 ， 对 表 的 内 部 存储 的 描述 应 该 是 不 可 见 的 一 一 用 户 不 用 指明 记 
录 存 储 在 哪里 、 怎 么 存储 ， 就 可 以 访问 表 和 记录 。 作 为 物理 数据 库 设 计 者 ， 必 须 提供 DBMS 
和 操作 系统 的 物理 设计 细节 。 对 于 DBMS ， 必 须 指明 用 于 代表 每 个 表 的 文件 的 组 织 方式 ;对 
于 操作 系统 ， 你 必须 指明 像 每 个 文件 的 位 置 和 安全 措施 这 样 的 细节 。 

步骤 5 包含 确定 应 该 如 何 实现 每 个 用 户 视图 。 步 又 6 包括 设计 安全 性 措施 以 保证 数据 不 会 
被 未 授权 的 用 户 访问 ， 包 括 在 基本 表 上 需要 的 访问 控制 。 

步 又 7 考虑 放宽 逻辑 数据 模型 提出 的 规范 化 约束 以 改善 整个 系统 的 性 能 。 这 个 步 难 应 该 仅 
在 需要 的 时 候 考虑 ， 因 为 在 维护 数据 一 致 性 时 还 要 考虑 引入 宛 余 所 带 来 的 问题 。 步 又 8 是 一 个 
监视 和 调整 正 操作 的 系统 的 持续 的 过 程 ， 用 于 标识 和 解决 由 数据 库 设计 产生 的 所 有 的 性 能 问 
题 ， 并 实现 新 的 需求 或 改变 需求 。 

附录 B 为 那些 已 经 熟悉 数据 库 设计 方法 学 的 用 户 总 结 了 方法 学 的 步骤 ， 并 且 简 单 地 对 主 
要 步骤 进行 了 回顾 。 在 本 章 余下 的 部 分 中 ， 我 们 说 明了 数据 库 设计 方法 学 的 步骤 3。 在 本 章 
和 接 下 来 的 几 章 中 ， 我 们 通过 描述 如 何 实现 可 选 设计 来 说 明 物理 数据 库 设计 和 实现 之 间 的 


12.3 步骤 3: 为 目标 DBMS 转 换 全 局 逻辑 数据 模型 


目标 从 过 辑 数据 模型 产生 基本 的 工作 关系 数据 库 。 


物理 数据 库 设 计 第 一 一 步 包括 将 从 逻辑 数据 模型 产生 的 表 转 换 为 在 目标 关系 DBMS 中 可 以 
实现 的 形式 。 这 步 的 第 一 部 分 要 比较 在 逻辑 数据 库 设 计 阶 段 收 集 的 信 ， 和 外 和 在 数据 字典 中 存档 
的 信息 。 这 步 的 第 二 部 分 要 使 用 这 些 信 息 进行 基本 表 的 设计 。 这 个 过 程 需要 具有 非常 了 解 目 
标 DBMS 所 提供 的 有 关 功能 的 知识 。 例 如 ， 应 该 知道 : 

。 怎 样 创建 基本 表 。 

“系统 是 否 支持 主键 、 外 键 和 备用 键 的 定义 。 

“系统 是 否 支持 所 需 数据 的 定义 ， 即 系统 是 否 允 许 某 列 被 定义 为 NOT NULL。 

“系统 是 否 支持 域 定义 。 

* 系统 是 否 支持 关系 完整 性 规则 。 

“系统 是 否 支持 业务 规则 定义 。 

步骤 3 中 的 三 个 任务 是 : 

。 步 最 3.1: 设计 基本 表 。 

* 步骤 3.2: 设计 派生 数据 的 表示 。 

* 步骤 3.3: 设计 其 他 业务 规则 。 


12.3.1 步骤 3.1: 设计 基本 表 
目的 确定 如 何在 目标 DBMS 中 描述 在 远 辑 数据 模型 标识 的 基本 表 、 
要 开始 物理 设计 过 程 ， 首先 要 比较 和 有 吸收 在 逻辑 数据 库 设计 阶段 创建 的 表 的 信息 。 这 





虑 
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必要 的 信息 可 以 从 数据 字典 中 获得 ， 并 且 使 用 数据 库 设 计 语言 (DBDL) 来 定义 表 。 对 每 个 在 
逻辑 数据 模型 中 标识 的 表 ， 应 该 有 如 下 的 定义 : 

。 表 名 。 

。 括 在 括号 内 的 简单 列 名 表 。 

。 主 键 以 及 在 适当 的 地 方 的 备用 键 (AK) 和 外 键 (FK )。 

。 任 何 标识 出 的 外 键 的 参照 完整 性 约束 。 

应 该 对 每 个 列 有 如 下 定义 : 

。 它 的 域 ， 包 括 数据 类 型 、 长 度 和 域 上 的 约束 。 

。 每 个 列 设置 可 选 的 默认 值 。 

。 该 列 是 否 可 以 为 空 。 

。 该 列 是 否 是 派生 列 ， 如 果 是 ， 怎 样 计算 。 

为 了 描述 基本 表 设 计 ， 我 们 使 用 DBDL 的 扩展 形式 来 定义 域 、 默 认 值 和 空 指示 。 例 如 ， 对 
于 图 10-8 所 定义 的 StayHome 数 据 库 应 用 的 Branch 表 ， 可 以 创建 如 图 12-2 所 示 的 设计 。 


Branch_Numbers 域 长 度 为 4 的 固定 长 度 的 字符 串 
Street_Names 域 基 大 长 度 为 30 的 可 变 长 度 的 字符 串 
City_Names 域 : 最 大 长 度 为 20 的 可 变 长 度 的 字符 串 
State_Codes 域 长 度 为 2 的 固定 长 度 的 字符 串 
Zip_Codes 域 长 度 为 5 的 固定 长 度 的 字符 上 
Staff_Numbers 域 长 度 为 5 的 固定 长 度 的 字符 串 
branch( branchNo Branch_Numbers NOT NULL， 
street Street_Names NOT NULL， 
city City_Names NOT NULL, 
state State_Names NOT NULL， 
zipCode Zip_Codes NOT NULL, 
mgrStaffNo Staff_Numbers NOT NULL) 
Primary Key branchNo 
Alternate Key zipCode 
Foreign Key mgrStaffNo References Staff (staffNo) ON UPDATE CASCADE ON DELETE NO ACTION 


图 12-2 使 用 扩展 DBDL 的 Branch 表 的 物理 设计 


1. 在 Access 2002 中 实现 基本 表 

接 下 来 就 是 要 确定 如 何 实现 基本 表 。 正 如 我 们 已 经 说 过 的 ， 这 个 决定 依赖 于 目标 DBMS ， 
有 些 系统 比 其 他 系统 提供 了 更 多 的 定义 基本 表 和 完整 性 约束 的 功能 。 为 了 演示 这 个 过 程 ， 我 
们 说 明了 如 何在 Microsoft Access 2002 中 创建 基本 表 以 及 完整 性 约束 。 在 第 18 章 ， 我 们 将 看 到 
如 何在 Oracle 9i 中 创建 表 和 一 致 性 约束 。 


当 讨 论 Microsoft Access 时 ， 我 们 使 用 开发 商 的 术语 ， 即 用 术语 “字段 ” 代替 “ 列 ”。 
Microsoft Access 提 供 了 五 种 创建 空 表 的 方法 : 

。 使 用 Database Wizard (数据 库 向 导 ) 在 一 个 操作 中 创建 整个 数据 库 需 要 的 全 部 表 、 窗 体 
和 报表 。 尽管 Database Wizard 不 能 用 于 在 已 经 存在 的 数据 库 中 添加 新 的 表 、 窗 体 和 报表 ， 
但 它 可 以 创建 一 个 新 的 数据 库 。 


"使 用 Table Wizard ( 表 向 导 ) 为 不 同 的 预定 义 的 表 选 择 字段 ， 这 些 表 包括 商业 合同 、 家 
庭 财产 清单 或 医疗 记录 。 














徊 12 童 物 理 数据 库 砚 矿 一 一 步 又 3 171 


。 直接 将 数据 输入 空 表 ( 称 为 数据 表单 )。 当 保存 新 的 数据 表单 时 ，Access 将 分 析 你 的 数 
据 ， 并 自动 为 每 个 字段 赋予 正确 的 数据 类 型 和 格式 。 

。 使 用 在 SQL View 中 的 CREATE TABLE 语 句 。 

。 使 用 Design View (设计 视图 )， 用 图 解 来 指明 表 的 所 有 细节 。 

2. 在 Microsoft Access 中 使 用 SQL 创 建 空 表 

在 3.3.1 节 中 ， 我 们 说 明了 SQL CREATE TABLE 语 句 ， 用 这 个 语句 可 以 创建 基本 表 。 
Microsoft Access 2002 并 没有 完全 遵从 SQL3 标 准 (例如 ，Access CREATE TABLE 语 句 不 支持 
DEFAULT 子 句 )， 但 正如 我 们 很 快 将 要 看 到 的 ， 默 认 值 和 某 些 业务 规则 仍 可 以 在 SQL 之 外 指 
定 。 另 外 ， 数 据 类 型 也 和 SQL 标准 有 一 点 不 同 ， 如 表 12-1 所 示 。 图 12-3 显 示 了 在 SQL View 中 
用 SQL 语句 创建 Branch 表 的 情况 (将 这 个 语句 与 3.3.1 节 的 等 价 的 SQL 语句 比较 )。. 











CREATE TABLE branch (branchkNo CHAR(4) NO NAL, 
Sreet 


YARCHAR(30) NOT MAL, 
Ry VARCHAR{20) NOT NULL, 
式 Be CHAR(Z) NOT NAL, 
Wode CHAR(S) NOT NULL UNIQUE, 
mor taffNo CHAR(S) NOT NL, 
CONSTRAINT pki PRIMARY KEY (brarchNo) 


CON5TRAINT ki FOREIGN KEY (mgrStaffNo) REFERENCES Staff); 






图 12-3 在 SQL View 中 创建 Branch 表 


3 表 12-1 Microsoft Access 数 据 类 型 
一 -~ 
数据 类 型 用 法 大 小 


Text 文本 或 文本 /数字 。 不 需要 计算 的 数字 ， 如 电话 号 码 最 多 255 个 字符 
Memo 较 长 文本 和 数字 ， 如 备注 或 描述 最 多 64000 个 字符 
Number 用 于 进行 算术 运算 的 数字 数据 ， 不 包括 货币 的 计算 (用 Currency 类 型 ) ”1、2、4 或 8 字 节 
Date/Time 日 期 和 时 间 8 字 节 
Currency 货币 值 。 使 用 Currency 数 据 类 型 防止 计算 时 的 舍 入 8 字 节 
Autonumber 唯一 顺序 号 (每 次 加 1) 或 者 是 随机 数字 ， 添 加 记录 时 自动 插入 4 字 节 
Yes/No 仅 包含 两 个 值 中 的 一 个 的 字段 ， 例 如 Yes/No、True/False、On/Off 1 位 
OLE Object 在 其 他 程序 中 使 用 OLE 协 议 创建 的 对 象 (例如 Microsoft Word 文 档 、 最 多 1GB 
Microsoft Excel 电 子 表格 、 图 片 、 声 音 或 其 他 二 进 制 数据 ) ， 可 以 链接 
或 戏 入 到 Microsoft Access 表 中 
Hyperlink 存储 超 链 接 的 字段 最 多 64000 个 字符 


Lookup Wizard 创建 充 许 从 其 他 的 表 或 从 列表 框 的 列表 值 中 选择 值 的 字段 在 数据 典型 为 4 字 节 
类 型 列表 中 选择 这 个 选项 ， 会 启动 一 个 向 导 来 指导 你 进行 定义 

图 12-4 为 创建 Branch 表 的 设计 视图 (Design View )。 不 论 你 用 什么 方法 创建 表 ， 都 可 以 使 
用 表 设 计 视 图 来 进一步 定制 你 的 表 ， 例 如 添加 新 的 域 、 设置 默认 值 或 者 创建 输入 掩 码 。 

3. 在 Access 中 创建 两 个 表 之 间 的 关系 

关系 是 在 Relationships 窗 口中 创建 的 。 要 创建 一 个 关系 ， 首 先 显示 要 创建 关系 的 表 ， 然后 
将 父 表 的 主键 属性 拖 到 子 表 的 外 键 属性 处 。 这 时 ， Access 将 显示 一 个 窗口 允许 指定 参照 完整 性 
约束 。 

图 12-5a 显 示 了 当 创 建 1 对 1 (1:1) 关系 : Staff Manages Branch 时 所 显示 的 参照 完整 性 对 
话 框 ， 图 12-5b 为 创建 完 关系 后 的 relationships 窗 口 。 
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用 于 设置 
mgStaffNo 默认 值 


字段 的 属性 





检索 mgStafftNo 以 便 将 来 为 ZipCode 设 置 设置 NOT NULL 


设置 1 : 1 关系 UNIQUE 约 束 约束 
图 12-4 创建 Branch 表 的 设计 视图 
显示 主键 /外 键 
的 字段 


选择 Staff 和 Branch 表 之 
间 的 参照 完整 性 约束 
选择 该 项 以 使 用 
ON UPDATE 
CASCADE 


不 为 ON DELETE 
NO ACTION 


显示 关系 的 基数 选择 该 项 
(本 例 为 1 : 1) 
a) 为 1 : 1 Staff Manages Branch 关 系 设置 参照 完整 性 约束 


» "Redationships 








b) 显示 1 : 1 Staff Manages Branch 关 系 的 relationships 窗 口 
图 12-5 创建 1 : 1 Staff Manages Branch 关 系 


在 Microsoft Access 中 ,设置 参照 完整 性 要 注意 如 下 两 点 : 
1) 只 要 相关 字段 中 的 一 个 是 主键 或 者 有 唯一 值 索引 ， 那 么 就 创建 一 对 多 (1:*) 关系 ; 如 
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果 两 个 相关 的 字段 都 是 主键 或 者 有 唯一 值 索 引 ， 那 么 就 创建 1 : 1 关系 。 因 此 ， 为 了 确保 
Manages 关 系 是 1 : 1 的 ， 不 仅 要 保证 Staff 表 中 的 staffNo 字 段 被 设 为 主键 ,而 且 必 须 保证 
Branch 表 中 的 mgrStaffNo 字 段 的 Indexed 属 性 设置 为 Yes (没有 重复 )， 如 图 12-4 所 示 。 

2) 就 更 新 和 删除 来 说 ， 只 有 两 个 参照 完整 性 动作 : NO ACTION 和 CASCADE。 因 此 ， 如 
果 在 步 又 2.4 定 义 完整 性 约束 中 标 识 了 其 他 的 动作 ， 则 必须 考虑 是 否 要 修改 这 些 约 束 使 它们 符 
合 Access 中 可 获得 的 约束 ， 或 者 要 研究 如 何 用 程序 代码 实现 这 些 约束 。 你 将 在 第 18 章 看 到 一 
个 如 何 实现 并 不 是 直接 由 目标 DBMS 支 持 的 参照 完整 性 的 例子 。 

4. 基本 表 的 存档 设计 

基本 表 的 设计 应 该 被 完全 记录 在 文档 中 ， 这 样 可 以 选择 设计 目标 ， 特 别 是 当 有 很 多 选择 
时 ， 记 录 下 选择 其 中 的 一 种 方法 的 原因 。 


12.3.2 步骤 3.2: 设计 派生 数据 的 表示 





| ”目标 设计 派生 数据 在 数据 库 中 的 表示 。 


如 果 一 个 列 的 值 可 以 从 其 他 列 得 到 ， 则 此 列 就 称 为 派生 列 或 计算 列 。 例 如 ， 下 述 列 都 是 
派生 列 : 

。 在 某 个 分 公司 工作 的 员工 人 数 。 

* 某 个 分 公司 的 全 部 员工 的 月 工资 总 和 。 

。 某 个 会 员 已 经 租借 的 录像 的 总 数 。 

正如 我 们 在 第 9 章 的 步骤 1.3 所 说 的 ， 派 生 列 经 常 不 出 现在 ER 模型 中 ， 但 作为 文档 出 现在 
数据 字典 中 。 如 果菜 个 派生 列 显 示 在 ER 模型 中 ， 则 在 这 个 名 字 的 前 边 用 一 个 “/” 来 表明 这 
个 列 是 派生 的 。 第 一 个 步 又 是 检测 逻辑 数据 模型 并 产生 一 个 包含 所 有 派生 列 的 列表 。 

从 物理 数据 库 设 计 的 角度 看 ， 将 派生 列 存储 在 数据 库 中 还 是 每 当 需 要 时 再 进行 计算 ， 需 
要 进行 一 下 权衡 。 为 了 确定 哪个 更 好 ， 应 该 考虑 : 

* 存储 派生 数据 的 代价 以 及 维护 它 与 派生 它 数据 的 一 致 性 的 代价 。 

* 每 次 计算 它 需 要 的 代价 。 

根据 性 能 约束 来 选择 一 种 代价 低 的 方式 。 对 于 上 面 给 出 的 最 后 的 例子 ， 应 该 在 Member 表 
中 存储 附加 的 列 来 表达 每 个 会 员 目 前 租借 的 录像 数目 。 RentalAgreement 表 和 Member 表 有 新 的 
派生 列 ， 如 图 12-6 所 示 。 

这 个 新 派生 列 的 附加 的 存储 并 不 是 特别 有 意义 的 ， 但 noOfRentals 列 需要 在 每 次 会 员 租借 
和 归还 录像 时 都 进行 修改 ， 应 该 确保 这 个 修改 是 一 致 的 以 维护 数据 的 正确 ， 并 因此 保证 数据 
库 的 一 致 性 。 通 过 按 这 种 方式 存储 数据 ， 当 查询 这 个 信息 时 ， 可 以 立刻 获得 这 个 值 而 且 不 再 
需要 进行 计算 。 

男 一 方面 ， 如 果 noOfRentals 列 不 直接 存储 在 Member 表 中 ， 那么 在 每 次 需要 这 个 值 时 都 必 
须要 计算 ， 这 个 计算 包括 连接 Member 和 RentalAgreement 表 。 例 如 ， 要 计算 会 员 “Don Nelson” 
目前 租借 的 录像 的 数量 ， 则 应 该 使 用 下 述 SQL 查询 : 


SELECT COUNT(*) AS noOfRentals 
FROM Member m, RentalAgreement ra 





WHERE m.memberNo=ra.memberNo AND m.fName = 'Don' AND 
m.lName = ‘Nelson' ，; 
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RentalAgreement 










R753461 4-Feb-03 6-Feb-03 M284354 245456 
R753462 4-Feb-03 6-Feb-03 M284354 243431 
R668256 5-Feb-03 7-Feb-03 M115656 199004 

2-Feb-03 M115656 178643 








M250178 
M166884 
MI11S65S6 
M284354 


37 -~ 11th Avenue, Seattle, WA 98105 
89 Redmond Rd, Portland, OR 97117 
22 W. Capital Way, Portiand, OR 97201 
123 Suffolk Lane, Seattie, WA 98117 


Adams 















Peters 









Parker 












Nelson 








图 12-6 有 派生 列 noOfRentals 的 RentalAgreement 表 和 Member 表 


如 果 经 常 进行 这 种 类 型 的 查询 或 者 从 性 能 的 角度 看 ， 这 是 一 个 关键 条 件 ， 则 将 这 个 派生 列 存 
储 起 来 比 在 每 次 需要 时 计算 它 更 合适 。 在 我 们 的 这 个 例子 中 ，StayHome 在 会 员 租借 新 录像 时 都 要 
运行 这 个 查询 。 通 过 与 StayHome 员 工 进行 讨论 ， 估计 RentalAgreement 表 大 约 有 400000 条 记录 ， 因 
此 ， 由 于 RentalAgreement 表 可 能 比较 大 而 且 经 常 需要 这 个 查询 ， 因此 可 以 决定 将 这 个 派生 列 加 到 
Member 表 中 会 效率 更 高 。 这 个 查询 现在 可 以 写成 : 

SELECT noOfRentals 


FROM Member 
WHERE fName = 'Don' AND lName = 'Nelson ' ; 


提示 当 系统 的 查询 语言 不 能 很 方便 地 使 用 算术 运算 来 计算 派生 列 时 ， 存储 派生 列 也 是 
个 很 好 的 方法 。 例 如 ，SQL 有 一 个 有 限 的 聚合 函数 集 ， 而 且 不 能 很 容易 地 处 理 递归 查 
为 派生 数据 设计 文档 
表达 派生 数据 的 设计 应 该 完全 记录 在 文档 中 ， 并 且 要 记 下 选择 某 个 设计 的 原因 。 特 别 是 ， 
当 有 很 多 方法 可 供 选 择 时 ， 尤其 要 记 下 选择 某 个 方法 的 原因 。 


12.3.3 步骤 3.3: 设计 其 他 业务 规则 


目标 为 目标 DBMS 设 计 其 他 业务 规则 。 


对 表 的 更 改 可 能 会 受 更 改 所 表达 的 控制 现实 世界 的 事务 业务 规则 的 约束 . 因此 ， 你 必须 
设计 域 约束 以 及 关系 完整 性 约束 。 这 个 步骤 的 目标 是 设计 应 用 到 数据 上 的 其 他 的 业务 规则 。 
这 些 规 则 的 设计 同样 要 依赖 于 所 选 的 DBMS， 有 些 系统 比 其 他 系统 提供 了 更 多 的 定义 业务 规 
则 的 功能 。 在 上 一 步骤 中 ， 如 果 系 统 遵 循 SQL2 标 准 ， 某 些 规则 的 实现 就 很 容易 。 例如 ， 
StayHome 中 有 这 样 一 条 规则 ， 要 防止 一 个 会 员 同时 租借 10 盘 以 上 的 录像 带 ， 可 以 把 这 个 规则 
设计 到 创建 RentalAgreement 表 的 SQL2 Create Table 语 句 中 ， 使 用 如 下 的 子 句 : 
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CONSTRAINT member_not_renting_ too_many 
CHECK (NOT EXISTS (SELECT memberno 
FROM rentalagreement 
GROUP BY memberno 
HAVING COUNT (*)>=10)) 


而 在 一 些 系统 中 ， 可 以 使 用 触发 器 来 加 强 约束 。 就 前 面 的 例子 来 说 ， 在 一 些 系统 中 ， 我 
们 可 以 创建 如 图 12-7 所 示 的 触发 器 来 增强 完整 性 约束 。 当 向 RentalAgreement 表 中 插入 一 条 记 
录 或 者 更 新 已 有 记录 时 ， 激 活该 触发 器 。 如 果 某 会 员 目 前 租借 了 10 盘 录像 带 ， 则 系统 显示 消 
息 并 且 终 止 事 务 。 

注意 不 要 过 于 考虑 触发 器 的 细节 问题 。 在 第 18 章 步骤 3.3 我 们 将 更 详细 地 讨论 触发 器 。 


1. 在 Microsoft Access 2002 中 创建 业务 规则 

在 Microsoft Access 2002 中 创建 业务 规则 有 几 种 方法 ， 例 如 : 
a) 确认 字段 规则 。 

b) 确认 记录 规则 。 

c) 使 用 VBA (Visual Basic for Application) 确 认 窗 体 。 

我 们 用 一 些 简 单 的 例子 说 明 上 面 的 每 一 点 。 










CREATE TRIGGER member_not_renting_too_many 
BEFORE INSERT OR UPDATE ON rentalagreement 
FOR EACH ROW 
DECLARE 

x NUMBER; 












BEGIN 
SELECT COUNT(*) INTO x 
FROM rentalagreement r 


WHERE r.memberno = :new.memberno; 
IF x >= 10 THEN 
raise_application_error(-20000, (‘Member’ ||:new.memberno|| 


‘already renting 10 videos’); 
END IF; 











图 12-7 每 个 会 员 不 能 一 次 租借 超过 10 盘 的 录像 带 的 触发 器 


(D 确认 字段 规则 

通过 定义 字段 确认 规则 ， 可 以 确保 输入 到 字段 中 的 数据 是 正确 的 。 字 段 确认 规则 用 来 检查 
用 户 放置 到 该 字段 中 的 数据 是 否 正确 。 如 果 输 入 的 值 违反 了 确认 规则 ， 将 会 显示 所 定义 的 提示 
消息 。 

例如 ，StayHome 有 一 个 简单 的 约束 ， 也 就 是 出 租 录像 的 返回 日 期 不 能 早 于 当前 日 期 ， 尽 
管 日 期 在 开始 时 可 能 未 被 指定 。 可 以 在 RentalAgreement 表 的 字段 级 使 用 函数 Date0 来 实现 此 
约束 ， 此 函数 返回 当前 日 期 如 图 12-8 所 示 。 

(2) 确认 记录 规则 

当 保存 一 条 完整 的 记录 的 时 候 ， 记 录 确 认 规则 将 起 作用 。 与 字段 确认 规则 不 同 ， 记 录 确 
认 规 则 可 以 引用 其 他 字段 。 当 你 想 比较 表 中 不 同 字段 的 值 时 ， 这 是 很 有 用 的 。 例 如 ， 
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StayHome 有 这 样 一 个 约束 ， 录 像 带 的 最 长 租 期 是 5 天 ， 尽 管 日 期 在 开始 时 可 能 并 未 指定 。 可 
以 使 用 确认 规则 在 RentalAgreement 表 的 记录 级 实现 该 约束 : 
[dateReturn] Is Null OR [dateReturn]<=[dateOut]+5 
图 12-9 为 具有 这 个 规则 集 的 表 的 Validation Rule 属 性 对 话 框 。 


orewmenr : Fabie 








默认 为 NULL 
确认 : 若 指定 
该 字段 ， 那 么 
日 期 至 少 必须 
是 当前 日 期 / 
如 果 日 期 不 符合 确认 规则 ， 


那么 显示 该 文本 


图 12-8 Microsoft Access 中 的 字段 确认 的 例子 








ul Or [dateReturn] <=[dateDut 
Sturn date must be within 5 days 





图 12-9 Microsoft Access 中 的 记录 确认 的 例子 


(3) 使 用 VBA (Visual Basic for Application) 确 认 窗 体 

正如 我 们 刚刚 提 到 的 ，StayHome 有 这 样 一 条 约束 ， 会 员 不 能 同时 租借 超过 10 盘 录像 带 。 
这 个 约束 更 复杂 一 些 ， 它 要 求 检查 该 会 员 当前 租 了 多 少 盘 录像 带 。 在 Access 中 实现 该 约束 的 
一 种 方法 是 使 用 事件 过 程 (BeforeUpdate )， 如 图 12-10 所 示 。BeforeUpdate 事 件 在 更 新 记录 前 
触发 ， 可 以 将 这 个 事件 与 相应 的 代码 相关 联 。 

在 一 些 系统 中 ， 可 能 不 支持 某 些 或 全 部 的 业务 规则 ， 这 时 在 应 用 程序 中 设计 规则 就 很 必 
要 ， 正 如 我 们 在 上 一 个 例子 中 所 看 到 的 ， 该 例子 已 经 用 VBA 代 码 实现 了 约束 。 当 然 ， 在 应 用 
代码 中 实现 业务 规则 存在 着 潜在 的 危险 ， 可 能 会 导致 加 倍 的 努力 ， 甚 至 更 精 ， 如 果 规则 不 是 
在 应 该 实现 的 地 方 都 实现 ， 那 么 将 会 导致 不 一 致 。 

2. 业务 规则 的 存档 设计 

业务 规则 的 设计 应 该 全 部 存档 。 尤 其 是 ， 当 有 多 种 选择 存在 的 时 候 ， 将 选择 其 中 一 种 方 
法 的 原因 存档 。 
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表单 上 的 字段 名 


MyQuery = “SELECT rentalno FROM rentalagreement WHERE memberno =”"+ memberNoField +”” 








Private Sub Form_ BeforeUpdate(Cancel As Integer) 
Dim MyDB As Database 

Dim MySet As Recordset 

Dim MyQuery As String 





‘Set up query to select all records for specified member’ 


‘Open the database and run the query’ 
Set MyDB = DBEngine .Workspaces (0).Databases (0) 
Set MySet = MyDB.OpenRecordset (MyQuery) 


‘Check if any records have been returned, then move to the end of the file to allow RecordCount’ 
‘property to be correctly set 
If (NOT MySet .EOF) Then 
MySet .MoveLast 
If (MySet.RecordCount >= 10) Then ‘If currently 10 - cannot rent any more 
MsgBox “Member currently has 10 videos out” 
Me .Undo 
End If 
End If 


MySet .Close 
MyDB .Close 
End Sub 








图 12-10 检查 会 员 当前 没有 租借 超过 10 盘 录像 带 的 VBA 代 码 


12.4 本 章 小 结 


* 物理 数据 库 设计 是 产生 在 二 级 存储 中 的 数据 库 的 实现 的 描述 的 过 程 ， 它 描述 了 基本 表 、 
文件 组 织 方式 和 用 于 实现 数据 有 效 访问 的 索引 以 及 任何 相关 的 完整 性 约束 和 安全 限制 。 
只 有 当 对 目标 DBMS 提 供 的 功能 有 全 面 的 认识 时 ， 才 可 以 着 手 基本 表 的 设计 。 

* 在 物理 数据 库 设计 的 初始 步骤 (步骤 3) 中 ， 将 逻辑 模型 转换 为 目标 关系 DBMS 中 可 以 
实现 的 形式 ， 包 括 设计 基本 表 、 表 达 派 生 的 数据 以 及 业务 规则 。 

* 在 接 下 来 的 步 又 ( 步 又 4) 中 ， 分 析 事务 并 基于 这 个 分 析 ， 设 计 文件 的 组 织 方式 和 用 于 
存储 基本 表 的 索引 。. 

* 数据库 代表 本 质 上 共同 的 资源 ， 所 以 这 个 资源 的 安全 性 是 极为 重要 的 。 步 又 5 和 步 又 6 的 
目标 就 是 设计 如 何 实 现在 逻辑 数据 库 设计 阶段 标识 的 安全 措施 。 这 可 能 包括 创建 用 户 视 
图 和 访问 控制 机 制 的 使 用 ， 例 如 SQL 所 提供 的 。 

“在 步骤 7 中 ， 考 虚 引 入 受 控 的 元 余 来 提高 系统 性 能 。 步 又 8 包括 监视 和 调整 操作 系统 来 获 
得 最 高 的 系统 性 能 。 


复习 题 
12.1 解释 逻辑 数据 库 设 计 和 物理 数据 库 设 计 之 间 的 差别 ， 为 什么 这 些 任务 要 由 不 同 的 人 
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完成 ? 
12.2 描述 物理 数据 库 设计 的 输入 和 输出 。 
12.3 描述 本 章 介绍 的 物理 设计 方法 学 中 的 主要 步骤 。 
12.4 描述 设计 基本 表 时 需要 的 信息 的 类 型 。 
12.5 描述 如 何在 数据 库 中 处 理 派生 数据 的 表达 。 给 出 能 够 说 明 你 的 答案 的 例子 。 


练习 


12.6 按照 你 的 方法 选择 附录 E 中 给 出 的 一 些 案 例 研 究 ， 在 某 个 你 访问 的 目标 DBMS 中 ， 
完成 本 章 所 讨论 的 物理 数据 库 设计 方法 学 中 的 步 又 。 








第 13 章 物理 数据 设计 一 一 步 又 4 

本 章 主题 : 

* 如 何 分 析 用 户 事务 来 确定 可 能 会 影响 性 能 的 特性 。 

"基于 对 事务 的 分 析 ， 如 何 选择 合适 的 文件 组 织 方式 。 

* 何 时 选择 索引 来 改善 系统 性 能 。 

本 章 介绍 物理 数据 库 设计 方法 学 的 步骤 4。 在 上 一 步 又 中 ,我们 说 明了 如 何 将 远 辑 设计 转换 
为 一 组 基本 表 ， 如 果 需 要 的 话 还 要 转换 为 业务 规则 。 但 是 ， 即 使 是 最 简单 的 数据 库 ， 为 了 获得 合 
适 的 性 能 也 必须 要 进行 额外 的 考虑 。 在 本 章 中 ， 我 们 考虑 物理 数据 库 设计 的 下 一 个 步 又， 这 一步 
中 要 考虑 与 文件 组 织 方式 和 索引 的 选择 是 否 正确 有 关 的 那些 系统 性 能 (方法 学 总 结 见 附录 B )。 


提示 如 果 不 束 悉 文件 组 织 方式 和 索引 的 概念 ， 我 们 强烈 建议 在 阅读 本 章 之 前 ， 先 阅读 
附录 D。 


与 逻辑 设计 相同 ， 物 理 设计 也 必须 遵循 数据 的 特性 以 及 用 途 。 尤 其 是 ， 必 须 理 解数 据 座 
要 支持 的 典型 工作 量 。 在 分 析 阶段 ， 你 也 可 能 发 现 某 些 用 户 会 有 这 样 的 需求 ， 要 求 革 些 事务 
洗 须要 运行 多 快 ， 或 者 每 秒 必须 要 处 理 多 少 个 事务 。 这 种 信息 构成 了 在 本 步 受 期 间 所 做 的 大 
量 决定 的 基础 。 

正如 我 们 前 面 所 提 到 的 ， 要 着 手 物理 数据 库 设计 ， 就 必须 理解 目标 DBMS 的 工作 ， 尤 其 
是 文件 组 织 方式 、 索 引 和 它 所 支持 的 查询 处 理 技术 。 例 如 ， 可 能 有 这 样 的 情况 ，DBMS 不 使 
用 二 级 索引 ， 即 使 允许 使 用 。 因 此 ， 添 加 二 级 索引 将 不 能 提高 系统 的 查询 性 能 ， 而 且 最 终 还 
可 能 是 不 正确 的 。 


你 可 能 回忆 起 来 在 第 3 章 中 ， SQL 和 QBE 是 非 过 程 化 数据 操纵 语言 (DML )。 这 样 
的 语言 隐藏 了 如 何在 辅助 存储 (二 级 ) 中 访问 数据 的 低层 细节 。 这 是 DBMS 的 工作 ， 
或 者 更 准确 些 ， 是 DBMS 的 查询 优化 器 的 工作 ， 典型 情况 下 ， 查 询 优 化 器 为 执行 用 户 
请 求 分 析 大 量 不 同 的 策略 ， 并 选择 其 中 认为 可 以 提供 最 佳 性 能 的 策略 ， 这 种 分 析 是 基 
于 数据 库 统计 所 估计 的 数据 库 操 作 的 消耗 的 ， 例如 表 中 记录 的 数量 、 每 条 记录 的 长 度 
和 索引 的 可 用 性 。 

DBMS 最 终 所 选择 的 策略 对 用 户 没有 影响 。 事 实 上 ， 你 将 发 现 你 可 以 定义 多 种 存 
储 结 构 ， 查询 优化 器 可 以 利用 这 些 结构 选择 最 优 的 策略 。 


13.1 步骤 4: 选择 文件 组 织 方式 和 索引 
目标 确定 最 佳 文件 组 织 广 


















式 来 存储 基本 表 以 及 实现 所 要 求 性 能 的 索引 。 


在 附录 D 中 ， 我 们 为 对 这 些 术语 不 熟悉 的 读者 提供 了 对 文件 组 织 方式 和 索引 的 简要 介绍 。 
这 时 复述 一 下， 文件 组 织 方式 是 指 当 文 件 存储 在 磁盘 上 时 ， 记 录 在 文件 中 的 排列 的 方式 。 末 
”是 一 种 数据 结构 ， 它 允许 DBMS 在 文件 中 更 快 地 定位 某 些 记录 ， 并 且 因 此 提高 对 用 户 井 询 
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的 响应 。 

可 以 获得 什么 样 的 文件 组 织 方式 依赖 于 目标 DBMS ， 有 些 系统 比 其 他 系统 提供 了 更 多 的 
文件 组 织 方 式 。 完 全 了 解 可 用 的 结构 ， 并 且 知 道 目 标 系统 怎样 使 用 这 些 结构 是 很 重要 的 。 

只 有 了 解 了 必须 要 支持 的 事务 的 细节 ， 才 能 做 出 有 意义 的 物理 设计 抉择 。 在 分 析 事 务 时 ， 
要 标识 出 性 能 标准 ， 例 如 : 

* 经 常 运行 的 事务 和 对 性 能 产生 重大 影响 的 事务 。 

* 业务 操作 的 关键 事务 。 

。 当 对 数据 库 有 很 高 要 求 时 ， 每 日 /每 周 内 访问 数据 库 的 次 数 ( 最 大 负荷 )。 

你 将 使 用 这 些 信息 来 标识 可 能 会 引起 性 能 问题 的 数据 库 部 分 。 同 时 ， 需 要 标识 事务 的 高 
层 功能 ， 例 如 在 更 新 事务 中 更 新 的 列 或 者 查询 中 检索 的 列 。 你 将 使 用 这 些 信息 来 选择 正确 的 
文件 组 织 方式 和 索引 。 

作为 结果 ， 我 们 将 步骤 4 分 为 如 下 几 步 : 

* 步 上 4.1: 分 析 事 务 。 

“。 步 又 4.2: 选择 文件 组 织 方式 。 

* 步骤 4.3: 选择 索引 。 


13.1.1 步骤 4.1: 分 桥 事 务 


目标 理解 运行 在 数据 库 上 的 事务 的 功能 并 分 析 重 要 的 事务 。 


要 进行 有 效 的 物理 数据 库 设计 ， 就 必须 要 很 好 地 理解 运行 在 数据 库 中 的 事务 。 


提示 在 许多 情况 中 ， 分 析 所 有 预期 的 事务 是 极为 费时 的 ， 因 此 应 该 至 少 研究 最 重要 的 
那些 事务 。 建 议 用 户 查 询 的 最 活路 的 20% 上 古 总 的 数据 访问 的 80%。 当 进行 分 析 时 ， 你 会 
发 现 这 个 80/20 规 则 是 很 有 用 的 方针 。 


为 了 帮助 标识 要 研究 的 那些 事务 ， 可 以 使 用 事务 应 用 图 (Transaction Usage Map )， 它 用 
图 形 的 方式 表明 了 哪些 表 潜 在 地 可 能 被 多 次 使 用 ， 或 者 使 用 事务 / 表 交 又 引用 矩阵， 它 显示 了 
每 个 事务 访问 的 表 。 为 了 将 日 光 主要 集中 在 有 问题 的 地 方 ， 一 种 处 理 方法 是 : 

1) 将 所 有 事务 路 径 映 射 到 表 中 。 

2) 确定 哪些 表 最 常 被 事务 访问 。 

3) 分 析 选 出 的 包含 了 这 些 表 的 事务 。 

1. 将 所 有 事务 路 径 映 射 到 表 中 

在 逻辑 数据 库 设 计 方法 学 的 步骤 1.8、 步 骤 2.3 和 步 难 3.2 中 ， 将 事务 路 径 映 射 到 实体 / 表 ， 
检查 模型 是 否 支持 用 户 所 需 的 事务 。 如 果 使 用 了 类 似 图 9-17 的 事务 路 径 图 表 ， 将 能 使 用 该 图 
. 表 来 确定 最 常 被 访问 的 表 。 另 一 方面 ， 如 果 以 另 一 种 方式 检查 事务 ， 将 会 发 现 创 建 一 张 事务 / 表 
的 交叉 引用 矩 阵 是 很 有 用 的 。 该 矩阵 显示 了 所 需 事务 ， 以 及 这 些 事务 所 访问 的 表 。 例 如 表 13-1 
就 是 为 StayHome 的 输入 、 更 新 /删除 和 检索 (也 称 为 查询 ) 事务 的 事务 / 表 交 叉 引 用 矩阵 
(StayHome 事 务 列表 参见 6.4.4 节 ): 

(e) 输入 在 一 指定 分 公司 登记 的 新 成 员 的 详细 信息 。 

(k) 更 新 /删除 指定 成 员 的 详细 信息 。 

(P) 根据 种 类 排序 ， 列 出 指定 分 公司 中 的 所 有 录像 的 标题 、 种 类 和 可 用 性 。 
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(q) 根据 标题 排序 ， 列 出 指定 分 公司 中 的 给 定 演员 姓名 的 所 有 录像 的 标题 、 种 类 和 可 用 性 。 
(r) 根据 标题 排序 ， 列 出 指定 分 公司 中 的 给 定 导 演 姓名 的 所 有 录像 的 标题 、 种 类 和 可 用 性 。 
(s) 列 出 指定 会 员 当 前 出 租 的 所 有 录像 的 详细 信息 。 

这 个 矩阵 以 可 视 化 的 方式 总 结 了 在 数据 库 中 运行 的 事务 的 访问 模式 。 例 如 ， 和 矩阵 表明 了 
束 务 《e) 读 Staff 表 并 且 也 向 Member 和 Registration 表 中 插入 记录 。 更 有 用 的 是 ， 你 可 以 表明 
每 个 小 格 中 ， 在 一 定时 间 间 隔 (例如 ， 每 小 时 、 每 天 、 每 周 ) 内 访问 的 数量 。 但 是 ， 为 了 保 
证 矩阵 的 简单 性 ， 我 们 并 不 显示 出 这 些 信息 。 该 矩阵 显示 出 Video 和 VideoForRent 表 被 四 个 
查询 事务 (p、q、r 和 s ) 访问 。 


表 13-1 交叉 引用 的 事务 和 表 
























































注 : 1 表示 插入 ; 民 表 示 读 取 ; U 表 示 更 新 ; D 表 示 删 除 。 


2. 确定 频率 信息 

在 对 StayHome 分 公司 经 理 进行 讨论 的 时 候 ， 估 计 大 概 有 20000 个 录像 带 标题 和 40000 盘 可 
出 租 的 录像 带 分 布 于 100 多 个 分 公司 办 公 室 中 ， 每 个 分 公司 平均 有 4000 盘 录像 带 ， 最 多 有 
10000 盘 录像 带 。 另 外 ， StayHome 保 存 了 大 约 1 0000 个 导演 和 60000 个 角色 中 的 30000 主 要 演员 
的 数据 。 图 13-1 为 添加 了 这 些 数据 的 简化 的 逻辑 数据 模型 ， * 

图 13-2 为 事务 《Pp)、(q) 和 (r) 的 事务 使 用 映射 图 ， 这 些 事务 都 访问 了 VideoForRent 和 Video 
表 。 由 于 VideoForRent 表 较 大 ， 因 此 尽 可 能 有 效 地 访问 该 表 是 很 重要 的 。 现 在 可 以 决定 对 包 
括 这 些 表 的 事务 进行 更 进一步 的 分 析 。 

在 考虑 每 个 事务 时 ， 不 仅 要 知道 每 小 时 运行 的 平均 次 数 和 最 大 次 数 ， 而 且 还 应 该 知道 事 
务 运行 的 日 期 和 了 时间， 包括 最 大 负荷 可 能 发 生 的 时 间 。 例 如 ， 有 些 事务 可 能 在 绝 大 多 数 时 间 
才 以 平均 速率 运行 ， 但 在 星期 五 早晨 的 会 议 前 的 星期 四 的 14:00 到 16:00 之 间 ， 产 生 最 大 负 共 ， 
其 他 事务 可 能 只 在 特定 的 时 间 运 行 ， 例 如 星期 五 /星期 六 的 18:00 到 21:00， 也 是 它们 的 蜂 信 

营 事 务 需要 经 常 访问 某 些 表 ， 那 么 它们 的 操作 模式 就 是 非常 重要 的 。 如 果 这 些 事务 以 相 
也 独立 的 方式 进行 操作 ， 那 么 可 能 的 系统 性 能 问题 就 会 减少. 但是， 如 果 操作 模式 有 溃 突 
中 应 更 仔细 地 检查 事务 来 确定 是 否 可 以 有 可 能 通过 改变 表 的 结构 来 改善 性 能 ， 从 而 减少 潜在 
的 问题 ， 正 如 我 们 要 在 第 15 章 步骤 7 中 所 讨论 的 。 . 
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(10 000) 











和 
VideoForRent 
(400 000) 


图 13-2 示例 事务 的 事务 使 用 映射 图 


3. 数据 应 用 分 析 

在 标识 了 重要 的 事务 之 后 ， 现 在 应 该 开始 更 详细 的 分 析 每 个 事务 。 对 每 个 事务 而 言 ， 应 
该 确定 : 

(a) 该 事务 访问 的 表 和 列 以 及 访问 的 类 型 。 也 就 是 ， 是 否 播 入、 更新、 删除 和 检索 (也 
称 为 查询 ) 事务 。 

对 于 更 新 事务 ， 要 注意 被 更 新 的 列 ， 因 为 这 些 列 可 能 是 避免 访问 结构 (例如 二 级 索引 ) 

(b) 在 查询 条 件 (在 SQL 中 ， 这 些 是 WHERE 子 句 中 的 条 件 ) 中 使 用 的 列 。 检 查 这 些 条 件 
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是 否 包括 : 
。 模 式 匹 配 ， 例 如 (name LIKE '%Smith%')。 
。 范 围 查找 ,例如 (salary BETWEEN 30000 AND 40000 ) 。 
。 准 确 匹 配 的 键 值 检索 ， 例 如 (salary=30000)。 
这 不 只 应 用 于 查询 而 且 也 应 用 于 更 新 和 删除 事务 ， 这 样 可 以 限定 表 中 被 更 新 /删除 的 记录 。 
。 这些 列 可 能 是 访问 结构 的 候选 。 
(c) 对 于 查询 ， 包 含 在 两 个 或 更 多 的 表 的 连接 中 的 列 。 
。 这 些 列 也 可 能 是 访问 结构 的 候选 。 
(d) 事务 运行 的 预期 频率 ， 例 如 ， 某 事务 每 天 大 约 运行 50 次 。 
(e) 事务 的 性 能 目标 ， 例 如 ， 事 务必 须 在 1 秒 钟 之 内 完成 。 
。 对 常用 和 关键 事务 中 的 查询 条 件 使 用 的 列 ， 需 要 比 访问 结构 有 更 高 的 优先 级 。 
图 13-3 显 示 了 事务 (p) 的 一 个 事务 分 析 模 式 的 例子 。 这 个 模式 显示 了 该 事务 平均 的 频率 
是 每 小 时 50 次 ， 峰 值 出 现在 18:00 到 21:00 之 间 ， 每 小 时 100 次 。 换 名 话说， 一 般 情况 下 ,大约 
一 半 的 分 公司 每 小 时 运行 该 事务 一 次 ， 在 顶峰 时 ， 所 有 分 公司 每 小 时 运行 该 事务 一 次 。 





200 000-500 000 400 000-1 000 000 
200 000-500 000 400 000-1 000 000 
ere 


图 13-3 样 例 事 务 分 析 模式 
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该 模式 也 显示 了 必需 的 SQL 语句 和 事务 使 用 映射 图 。 在 这 个 阶段 ， 写 出 全 部 的 SQL 语句 
就 过 于 详细 了 ， 但 至 少 应 该 标识 出 与 SQL 语句 相连 的 细节 类 型 ， 也 就 是 : 

。 将 要 使 用 的 所 有 查询 条 件 。 

。 连 接 表 所 需 的 列 (对 查询 事务 来 说 )。 

。 用 于 排序 的 列 (对 查询 事务 来 说 )。 

。 用 于 分 组 的 列 ( 对 查询 事务 来 说 )。 

。 可 能 使 用 的 内 置 函数 (例如 AVG、SUM )。 

。 被 该 事务 更 新 的 列 。 

我 们 将 使 用 这 些 信息 来 确定 所 需 的 索引 ， 这 些 很 快 就 要 讨论 。 在 事务 使 用 映射 图 下 面 ， 
有 详细 的 细 目 文档 : 

。 每 个 表 如 何 被 访问 (在 这 里 是 读 )。 

。 事务 运行 时 ， 每 次 访问 多 少 记录 。 

* 每 小 时 平均 和 峰值 时 访问 多 少 记录 。 

注意 对 于 更 新 事务 而 言 ， 对 表 进 行 两 次 访问 : 一 个 是 读数 据 ， 一 个 是 更 新 数据 。 


频率 信息 将 标识 需要 仔细 考虑 的 表 ， 以 确保 正确 使 用 访问 结构 。 正 如 前 面 所 提 到 的 ， 有 
时 间 约 束 的 事务 使 用 的 查询 条 件 要 比 访问 结构 更 优先 。 


13.1.2 步骤 4.2: 选择 文件 组 织 方式 


目标 确定 每 个 基本 表 的 有 效 文 件 组 织 方式 。 


物理 数据 库 设计 的 主要 目标 之 一 就 是 以 有 效 方 式 存储 数据 。 例 如 ， 如 果 想 接 姓名 以 字母 
顺序 检索 员工 记录 ， 则 用 员工 姓名 对 文件 排序 就 是 很 好 的 文件 组 织 式 。 但 是 ， 如 果 想 要 检 
索 所 有 工资 在 某 个 范围 内 的 员工 ， 则 按 员 工 姓名 排序 的 文件 就 不 是 好 的 文件 组 织 方式 。 

一 些 文件 组 织 方式 对 成 批 处 理 数据 进入 数据 库 是 很 有 效率 的 。 换 句 话说 ， 你 可 能 想 使 用 
有 效 的 存储 结构 来 建立 数据 库 ， 然 后 为 通常 的 操作 使 用 来 改变 它 。 

因此 ， 如 果 目 标 DBMS 人 允许， 这 步 的 目标 是 为 每 个 表 选择 最 佳 的 文件 组 织 方 式 。 在 许多 
方面 , 你 可 能 发 现 关系 DBMS 基 本 不 允许 你 选择 文件 组 织 方式 , 尽管 有 些 DBMS 人 允许 创建 索引 . 

我 们 在 附录 D 中 给 出 了 选择 文件 组 织 方式 的 指南 。 如 果 你 的 日 标 DBMS 不 允许 选择 文件 的 
组 织 方式 ， 则 你 可 以 省 略 这 个 步骤 进 入 到 下 一 个 步骤 一 步骤 4.3。 

将 文件 组 织 方式 的 选择 存档 

文件 组 织 方式 的 选择 以 及 选择 的 原因 应 该 全 部 存档 。 尤 其 是 在 有 多 种 选择 存在 时 ， 选 择 
其 中 一 种 文件 组 织 方式 的 原因 一 定 要 存档 。 


13.1.3 步骤 4.3， 选择 索引 





目标 确定 添加 索引 是 否 会 改善 系统 性 能 。 


为 表 选择 正确 的 文件 组 织 方式 的 一 种 方法 是 保持 记录 的 无 序 性 并 且 创 建 所 需 数目 的 一 级 
索引 。 另 一 种 方法 是 通过 指定 主键 或 聚 猎 索 引 使 表 中 记录 为 有 序 的 。 这 种 情况 下 ， 应 该 选择 
如 下 列 来 排序 或 者 聚 徐 索引 记录 。 
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* 经 常用 于 连接 操作 的 列 ， 因 为 这 样 使 连接 更 有 效率 。 
。 在 表 中 经 常 按 某 列 的 顺序 访问 记录 的 列 。 
如 果 选 择 排序 的 列 是 表 的 键 ， 那 么 该 索引 就 是 主 索引 ; 如 果 排 序 的 列 不 是 键 ， 那 么 该 索 
引 就 是 聚 敌 索引 。 记 住 每 个 文件 只 能 有 一 个 主 索引 或 者 是 一 个 讼 灸 索引 ， 而 不 能 两 者 兼 有 。 
指定 索引 


SQL 标 准 的 初始 版 本 有 创建 和 删除 索引 的 语句 。 但 是 ， 这 些 语 向 在 1992 年 该 标准 
的 第 2 版 中 被 删除 了 ， 因 为 它们 主要 被 认为 是 物理 概念 ， 而 不 是 逻辑 概念 。 不 过 ， 绝 大 


多 数 主流 关系 DBMS 以 这 样 或 那样 的 形式 支持 这 些 语 身 。 我 们 下 面 所 使 用 的 这 些 SQL 语 
向 就 是 目前 产品 所 支持 的 典型 语句 。 


用 SQL 创 建 索引 ， 通 常 使 用 CREATE INDEX 语 句 。 例 如 ， 为 Video 表 创建 基于 catalogNo 
列 的 主 索 引 ， 可 以 使 用 如 下 SQL 语句 : 
CREATE UNIQUE INDEX catalogno_index 


ON videolcatalogno) : 


如 打 想 为 videoForRent 表 创建 基于 catalogNo 列 的 聚 乱 索引 ， 可 以 使 用 如 下 的 SQL 语句 : 


CREATE INDEX catalogno_index 
ON videoforrent (catalogno) CLUSTER; 


正如 我 们 已 经 提 到 的 ， 在 某 些 系 统 中 文件 的 组 织 是 固定 的 。 例 如 ， 不 久 前 ， Oracle 还 只 支 
持 B 树 ， 但 现在 增加 了 对 哈 希 聚 位 的 支持 。 另 一 方面 ， INGRES 提 供 了 范围 更 广 的 不 同 索引 结 
构 ， 在 CREATE INDEX 语 名 中 可 以 使 用 选项 子 句 进行 选择 : 

[STRUCTURE = BTREE | ISAM | HASH | HEAP ] | 

用 SQL 删 除 索 引 ， 一 般 可 以 使 用 DROP INDEX 语 句 。 例 如 ， 删除 衰 秘 索引 
catalogNo_Index， 可 以 使 用 如 下 SQL 语句 : 


DROP INDEX catalogNoPrimaryIndex; 














注意 ，Microsoft Access 不 支持 CREATE INDEX 语 向， 但 可 以 通过 字段 属性 对 话 框 
来 创建 索引 。 我 们 在 图 12-4 中 可 以 看 到 这 样 一 个 例子 ， 并 详细 地 讨论 了 这 个 问题 


2. 选择 二 级 索引 

二 级 索引 提供 了 为 基本 表 指 定 其 他 键 的 机 制 ， 可 以 用 于 更 有 效 地 检索 数据 。 例 如 ， 
Member 表 在 会 员 号 memberNo 上 进行 Hash 映 射 ， 也 就 是 主 索引 。 但 是 ， 可 能 会 有 经 常 使 用 基 
于 IName (名 字 ) 列 来 访问 数据 ， 这 时 ， 就 可 以 决定 增加 IName 作 为 二 级 索引 。 

但 是 ， 在 保持 和 使 用 二 级 索引 时 还 要 考虑 到 当 检 索 数 据 时 ， 必须 要 平衡 改善 性 能 。 考虑 如 下 : 

* 每 当 在 表 中 插入 一 条 记录 时 ， 都 要 给 每 个 二 级 索引 增加 一 个 索引 记录 。 

* 当 表 中 相应 记录 被 更 新 时 ， 也 要 更 新 二 级 索引 。 

"需要 使 用 额外 的 磁盘 空 间 来 存储 二 级 索引 。 

“ 在 查询 优化 期 间 ， 性 能 可 能 退化 ， 因为 在 选择 最 佳 执行 策略 之 前 ， 查询 优化 器 可 能 考虑 

所 有 的 二 级 索引 。 

3. 选择 索引 “意愿 表 ” 的 方针 

确定 需要 什么 样 的 二 级 素 引 的 一 种 方法 就 是 创建 你 认为 是 索引 的 候选 列 的 “意愿 玫 ， 











(wish-list)， 然 后 考虑 维护 每 个 这 样 的 索引 的 影响 。 我 们 提供 如 下 方法 帮助 你 创建 “意愿 表 

1) 不 必 为 小 表 创 建 索引 。 在 内 存 中 查询 该 表 会 比 存储 额外 的 索引 结构 更 加 有 效 。 

2) 一 般 情 况 下 ， 如 果 没 有 文件 组 织 方 式 的 键 ， 则 索引 表 的 主键 。 尽管 SQL 标准 提供 了 指明 
主键 的 子 句 (在 上 一 章 的 步 又 3.1 中 讨论 )， 但 这 并 不 保证 在 某 些 RPBMS 中 主键 将 被 素 引 。 

3) 为 检索 数据 时 大 量 使 用 的 列 增加 二 级 索引 (例如 ， 为 Member 表 增加 基于 IName 列 的 二 
级 索引 ， 如 前 面 所 述 )。 

4) 如 果 经 常 基于 外 键 访问 数据 ， 则 为 该 外 键 增加 二 级 索引 。 例 如 ， 可 能 要 经 常 使 用 
branchNo 列 (分 公司 号 ) 来 连接 VideoForRent 表 和 Branch 表 。 则 为 VideoForRent 表 创建 基于 
branchNo 的 二 级 索引 会 更 有 效率 。 

5) 为 经 常 有 如 下 情况 的 列 添加 二 级 索引 : 

。 查 询 或 连接 条 件 

*。 ORDER BY 

。 GROUP BY 

。 其 他 操作 包括 排序 (例如 UNION 或 DISTINCT) 

6) 为 在 内 置 钞 数 包含 的 列 增加 二 级 索引 ， 包 括 内 置 函 数 中 用 于 聚 徐 的 列 。 例 如 ， 要 知道 
每 个 分 公司 中 员工 的 平均 工资 ， 可 以 使 用 如 下 的 SQL 查询 : 

SELECT branchNo,AvVvG{(salary) 


FROM Staff 
GROUP BY branchNo; 


由 前 面 的 方针 可 知 ， 由 于 有 GROUP BY 子 句 ， 因 此 可 以 考虑 为 branchNo 列 添加 索引 。 但 
是 ， 为 branchNo 列 和 salary 列 共同 创建 索引 会 更 加 有 效 ， 因 为 这 使 得 DBMS 只 根据 索引 中 的 数 
据 就 可 以 完成 整个 查询 ， 而 不 需要 访问 数据 文件 。 有 时 ， 这 被 称 为 仅 索引 计划 (index-only 
plan) ， 因 为 只 使 用 索引 中 的 数据 就 可 以 产生 所 需 的 响应 。 

7) 作为 比 上 一 种 情况 更 一 般 的 情况 ， 为 可 以 导致 仅 索引 计划 的 列 添 加 二 级 索引 。 

8) 避免 为 经 常 被 更 新 的 列 或 表 设 置 索引 。 

9) 如 果 查 询 将 检索 表 中 记录 的 大 部 分 (例如 25% ) ， 即 使 表 很 大 ， 也 不 创建 索引 。 这 时 ， 
查询 整 表 要 比 用 索引 查询 更 有 效 。 

10) 避免 为 由 长 字符 串 组 成 的 列 创建 索引 。 


提示 ”如果 查 询 条 件 包 含 多 个 条 件 ， 并 且 条 件 中 包括 一 个 OR 子 向 ， 而 该 条 件 没有 索引 / 
排序 ， 那 么 为 其 他 列 添加 索引 将 不 会 改善 查询 速度 ， 因 为 仍然 需要 表 的 线性 查找 。 例 
如 ， 假 定 只 有 Video 表 的 category 和 dailyRental 列 有 索引 ， 并 且 要 使 用 如 下 查询 : 

SELECT * 

FROM video 

WHERE (category = 'Action' OR dailyrental > 3 OR price > 15); 

尽管 这 两 个 索引 可 以 用 来 查找 满 足 category = 'Action OR dailyRental > 3 OR price > 
15 条 件 的 记录 , 但 price 列 没有 索引 的 事实 意味 着 这 些 索引 并 不 能 用 于 整个 WHERE 子 铅 。 
因此 ， 除非 有 其 他 查询 可 以 从 category 和 dailyRental 列 的 索引 得 到 好 处 ， 对 本 查询 是 不 
会 有 索引 方面 的 益处 的 。 

但 另 一 方面 ， 如 果 WHERE 子 向 中 的 查询 条 件 是 AND， 那 么 category 和 dailyRental 列 
的 两 个 索引 就 可 以 优化 查询 。 
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从 “意愿 表 ” 中 删除 索引 . 

已 经 画 出 了 潜在 索引 的 意愿 表 ; 现在 该 考虑 在 更 新 事务 上 每 个 可 能 的 索引 的 影响 。 如 果 
维护 索引 可 能 会 降低 重要 的 更 新 事务 ， 那 么 就 考虑 从 表 中 删除 该 索引 。 但 是 ， 要 注意 ， 特 殊 
的 索引 可 能 也 会 令 更 新 操作 更 有 效 。 例 如 ， 如 果 想 更 新 给 定员 工 号 码 (staffNo) 的 员工 的 工 
资 ， 并 且 在 stafftNo 列 上 有 索引 ， 那 么 就 可 以 更 快 地 找到 要 被 更 新 的 记录 。 


提示 “ 当 确定 索引 是 否 能 改善 性 能 、 改 善 的 性 能 很 小 或 者 是 相反 方向 的 影响 时 ， 最 好 的 
方法 就 是 进行 试验 。 在 最 后 一 种 情况 中 ， 很 明显 应 该 把 该 索引 从 “就 愿 表 ”中 删除 。 
如 果 使 用 索引 对 性 能 有 微小 的 改善 ， 那 么 有 必要 进一步 检查 在 什么 样 的 情况 下 索引 是 
有 用 的 ， 是 否 这 些 情况 对 实现 该 索引 是 十 分 重要 的 。 


对 于 执行 一 个 特殊 的 查询 或 者 更 新 ， 有 时 称 为 查询 执行 计划 (QEP)， 有 些 系统 允许 检查 
优化 器 的 策略 。 例 如 ，Oracle 有 EXPLAIN PLAN 诊断 实用 工具 ，Microsotft Access 有 一 个 性 能 
分 析 器 ，DB2 有 一 个 EXPLAIN 实 用 工具 ，INGRES 有 一 个 在 线 QEP- 视 图 工具 。 当 查询 比 预 其 
的 慢 时 ， 更 应 该 使 用 这 些 工 具 来 确定 变 慢 的 原因 ， 从 而 找到 可 以 改善 查询 性 能 的 可 选 策略 。 


提示 如 果 大 量 的 记录 被 插入 到 有 索引 的 表 中 ， 可 以 先 删 除 索 引 ， 再 执行 插入 ， 然 后 再 
重新 创建 索引 会 更 有 效 。 作 为 一 个 不 成 文 的 规则 ， 如 果 插 入 动作 将 增加 表 的 10 儿 的 大 
小 ， 那 么 暂时 将 索引 删除 。 


4. 更 新 数据 库 策略 

我 们 在 前 面 提 到 过 ， 查 询 优化 器 依赖 于 存储 在 系统 目录 中 的 数据 库 统 计 来 选择 最 佳 的 策 
略 。 每 当 创建 索引 时 ，DBMS 自 动 地 将 此 索引 增加 到 系统 目录 中 。 但 是 ， 你 会 发 现 DBMS 要 求 
使 用 一 个 工具 来 更 新 系统 目录 中 与 表 和 索引 相关 的 统计 信息 (系统 目录 定义 参见 1.2.1 市 )。 

5. 将 索引 的 选择 存档 : 

索引 的 选择 以 及 选择 的 原因 应 该 全 部 存档 。 特别 是 那些 出 于 性 能 的 原因 不 能 他 建 索引 的 
列 ， 也 应 该 存档 。 


13.2 使 用 Microsoft Access 2002 的 StayHome 文 件 的 组 织 与 索引 


即使 不 是 全 部 ， 也 同 大 部 分 的 PC DBMS 一 样 ，Microsoft Access 使 用 了 固定 的 文件 组 织 方 
式 ， 如 果 使 用 Access， 则 步骤 4.2 就 可 以 省 略 。 


13.2.1 选择 索引 指南 


Microsoft Access 确 实 支持 我 们 现 现在 正 简要 讨论 人 的 索引 。 在 Access 中 ， 表 的 主键 是 自动 被 
索引 的 ， 但 是 数据 类 型 为 Memo、Hyperlink 或 OLE 对 象 的 字段 是 不 能 被 索引 的 。 对 其 他 字段 
来 说 ，Microsoft 建议 满足 如 下 条 件 时 ， 为 该 字段 创建 索引 : 

。 字 7 段 的 数据 类 型 是 Text、Number、Currency 或 Date/Time。 

。 想 要 查询 存储 在 该 字段 中 的 值 。 

。 想 要 对 该 字段 中 的 值 排序 。 

“。 想 要 存储 该 字段 中 的 许多 不 同 的 值 。 如 果 该 字段 中 许多 值 是 相同 的 ， 索 引 可 能 不 会 显著 

提高 查询 速度 。 

另外 ，Microsoft 建议 : 
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*。 应 该 从 连接 的 两 边 或 者 是 关系 两 边 的 字段 考虑 索引 字段 ,这 时 ,如果 还 不 存在 索引 的 话 ， 
Access 将 会 自动 创建 外 键 字 段 上 的 索引 。 
。 当 用 连接 字段 的 值 对 记录 分 组 的 时 候 ， 应 该 为 该 表 中 与 计算 列 相同 的 列 指定 GROUP BY 子 句 。 
Microsoft Access 可 以 优化 简单 和 复杂 的 查询 条 件 (Access 中 称 为 表达 式 )。 就 某 些 特殊 类 
型 的 复杂 表达 式 来 说 ，Microsoft Access 使 用 称 作 Rushmore 的 数据 访问 技术 来 实现 更 高 级 的 优 
化 。 复 杂 表 达 式 是 由 用 AND 或 OR 连接 的 两 个 简单 表达 式 组 成 的 ， 例 如 : 


branchno = 'B001' AND available = Yes 
Category = 'Action' OR dailyrental > 3 


在 Access 中 ， 复 杂 表 达 式 是 否 全 部 或 部 分 可 优化 ， 依 赖 于 一 个 或 两 个 简单 表达 式 是 否 是 
可 优化 的 ， 以 及 是 用 什么 操作 符 连接 他 们 的 。 如 果 下 面 三 个 条 件 全 都 满足 ， 那 么 复杂 表达 式 
就 是 可 优化 的 : 

* 该 表达 式 使 用 AND 或 OR 来 连接 两 个 条 件 。 

* 两 个 条 件 都 是 由 简单 的 可 优化 表达 式 组 成 的 。 

* 两 个 表达 式 都 包含 索引 字段 。 这 些 字段 可 独立 地 进行 索引 或 者 它们 是 复合 字段 索引 的 一 部 分 。 

在 Access 中 创建 索引 

在 Access 中 ， 可 以 在 表 的 Design View (设计 视图 ) 中 的 Field Properties (字段 属性 ) 中 
的 Indexed 属 性 中 创建 索引 。 索 引 属 性 有 如 下 值 : 


No 无 索引 (默认 ) 
Yes (可 重复 ) 索引 允许 重复 
Yes (不 可 重复 ) 索引 不 允许 重复 


我 们 可 以 在 上 一 章 的 图 12-4 中 看 到 为 mgrStaffNo 列 设置 索引 的 示例 。 
13.2.2 StayHome 的 索引 

基于 上 面 所 提 到 的 方针 ， 你 应 该 确保 为 每 个 表 创建 了 主键 ， 这 样 Access 会 自动 为 该 列 添加 
索引 。 另 外 ， 应 该 确保 在 Relationships 窗 口中 正确 地 创建 了 关系 ， 这 样 Access 会 自动 为 外 键 列 添 


加 索引 。 
表 13-2 StayHome 的 Branch 视 图 的 附加 索引 


一 一 
表 列 事 务 原 因 

CC 
Branch city (m) 搜索 条 件 


Staff name (n) 排序 
Video category (Pp) 排序 
(u) 搜索 条 件 
(Vv) 分 组 
title (9)、(D、(u) 排序 
© 搜索 条 件 
Actor actorName (q) 搜索 条 件 
(x) 分 组 、 排 序 
Director directorName {r) 搜索 条 件 
Member fName/Iname (s) 搜索 条 件 
RentalAgreement dateReturn (s) 搜索 条 件 


Registration dateJoined (y) 搜索 条 件 
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从 6.4.4 节 中 所 列 的 StayHome 的 事务 中 ， 可 以 确定 创建 如 图 13-2 所 示 的 索引 。 该 图 显示 了 
每 个 表 中 应 该 被 索引 的 列 、 使 用 该 列 的 事务 、 以 及 添加 该 索引 (因为 该 列 在 查询 条 件 中 被 作 
为 排序 列 中 的 搜索 条 件 ， 或 者 被 作为 分 组 列 ) 的 原因 。 作 为 练习 ， 为 附录 C 中 给 出 的 
StayHome 的 Business 视 图 中 的 事务 建立 索引 文档 。 


注意 ”在 VideoForRent 表 中 ，available 列 被 事务 用 作 查 询 条 件 。 但 是 ， 这 个 列 只 有 两 个 
值 (Y 或 N)， 因 此 ， 由 前 面 所 提 到 的 指导 方针 可 知 ， 并 不 值得 为 该 列 建立 索引 。 


13.3 本 章 小 结 


“* 在 步骤 4 中 ， 你 选择 最 佳 文件 组 织 方式 来 存储 基本 表 和 获得 所 需 性 能 所 必需 的 索引 。 这 包 
括 分 析 数 据 库 上 要 运行 的 事务 、 选 择 合适 的 基于 这 些 分 析 的 文件 组 织 方式 和 添加 索引 。 

* 在 理解 要 支持 的 事务 的 细节 之 前 ， 是 不 能 做 出 有 意义 的 物理 设计 决定 的 。 这 包括 分 析 最 
重要 的 事务 ， 也 就 是 ， 最 常 运行 或 者 业务 操作 的 关键 事务 。 

" 二 级 索引 提供 了 为 基本 表 说 明 其 他 键 的 机 制 ， 这 可 用 于 更 有 效 地 检索 表 。 但 是 ， 在 维护 
和 使 用 二 级 索引 时 还 要 考虑 到 当 检索 数据 时 ， 必 须要 平衡 改善 性 能 。 

. 为 表 选 择 合适 的 文件 组 织 方式 的 一 种 方法 是 保持 记录 的 无 序 , 并 且 创建 所 名 的 一 级 索引 
另 一 种 方法 是 将 表 中 的 记录 由 指定 的 主键 或 者 聚 篮 素 引 来 排序 。 

"确定 所 需要 的 二 级 索引 的 一 种 方法 是 创建 索引 候选 列 的 “意愿 表 ” ， 然 后 后 考虑 维护 这 些 
索引 的 影响 。 


复习 题 


13.1 描述 数据 库 设计 方法 学 中 步 又 4 的 目的 。 

13.2 讨论 分 析 必 须 支 持 的 事务 的 目的 并 描述 应 该 收集 和 分 析 的 信息 类 型 。 
13.3 什么 时 候 不 在 表 中 添加 任何 索引 ? 

13.4 讨论 选择 一 个 列 作为 候选 索引 的 主要 原因 。 给 出 能 够 说 明 你 的 答案 的 例子 。 
13.5 如 果 已 经 标识 了 某 个 列 作 为 候选 索引 ， 在 什么 环境 下 决定 对 它 已 进行 索引 ? 


练习 


13.6 按 你 的 方式 利用 附录 E 中 给 出 的 一 些 案例 研究 进行 练习 ， 对 目标 DBMS 应 用 在 本 音 
中 讨论 的 物理 设计 方法 学 中 的 步骤 。 











第 14 章 物理 数据 库 设 计 一 一 步骤 5 和 步骤 6 

本 章 主题 : 

“数据 库 代 表 了 共同 的 资源 ， 必 须要 保证 其 安全 性 。 

。 如 何 设计 用 户 视图 。 

。 怎 样 设计 安全 机 制 来 满足 用 户 需求 。 

本 章 介 绍 数 据 库 设 计 方 法 学 的 步骤 5 和 步骤 6。 在 前 面 的 两 章 中 ， 我 们 将 逻辑 设计 转换 为 
一 组 基本 表 和 业务 规则 ， 并 选择 了 合适 的 文件 组 织 方式 和 基于 最 重要 事务 分 析 的 索引 。 在 本 
章 中 ， 我 们 研究 如 何 设计 在 数据 库 应 用 生命 周期 的 需求 分 析 和 收集 阶段 标识 的 用 户 视图 以 及 
安全 性 机 制 。 与 物理 数据 库 设 计 的 其 他 步骤 相同 ， 实 现 用 户 视图 和 安全 机 制 也 依赖 于 目标 
DBMS 。 


14.1 步骤 5: 设计 用 户 视图 
目标 设计 关系 数据 库 应 用 生命 周期 分 析 阶 段 所 标识 的 用 户 视图 。 


数据 库 设 计 方法 学 的 第 一 个 步骤 包括 为 数据 库 分 析 阶 段 标识 的 每 个 视图 或 合并 后 的 用 户 
视图 产生 逻辑 数据 模型 。 在 6.4.4 节 ， 我 们 为 StayHome 标 识 了 五 个 视图 ， 即 Manager、 
Supervisor、Assistant、Director 和 Buyer。 按 照 这 些 用 户 视图 的 数据 需求 分 析 ， 我 们 使 用 集中 
式 方 法 将 用 户 视图 的 需求 合并 为 如 下 两 个 : 

。Branch ， 包 括 Manager、Supervisor 和 Assistant 用 户 视图 。 

。Business， 包 括 Director 和 Buyer 用 户 视 图 。 . 

本 步骤 的 目的 是 设计 前 面 所 标识 的 所 有 用 户 视图 。 对 个 人 计算 机 上 的 独立 的 DBMS， 使 
用 视图 通常 是 很 方便 的 ， 它 用 来 简化 查询 。 但 是 ， 在 多 用 户 的 DBMS 中 ， 视 图 在 定义 数据 库 
结构 和 加 强 安全 性 上 扮演 了 重要 的 角色 。 在 第 12 章 所 讨论 的 基本 表 设 计 中 ， 为 了 说 明 此 过 程 ， 
我 们 介绍 了 创建 视图 所 使 用 的 两 种 方式 : 

。1999 ISO SQL 标准 (SQL3) 

。Microsoft Access 2002 

1. 1999 ISO SQL 标准 (SQL3 ) 

通常 ， 视 图 使 用 SQL 或 类 似 QBE 的 工具 来 创建 。 例 如 ， 对 分 公司 B001 的 监理 和 助理 ， 你 
可 能 希望 创建 基本 表 Staff 的 视图 ， 这 个 视图 不 包含 工资 信息 。 创 建 此 视图 的 SQL 语句 为 : 

CREATE VIEW Staffl View 

AS SELECT staffNo,name,position 

FROM Staff 
WHERE branchNo = 'B001': 

这 条 语句 创建 了 与 Staff 表 具有 相同 列 ， 但 没有 salary 和 branchNo 列 的 视图 ， 此 视图 的 名 字 

为 Staffl_View。 如 果 查 询 此 视图 ， 将 得 到 图 14-1 所 示 的 数据 。 
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网 基于 人 





| position “| 


me 1S00 Tom | Manager 
Sally Adams Assistant 
图 14-1 Staffl_View 视 图 的 列表 


为 了 确保 只 有 分 公司 的 经 理 可 以 看 到 salary 列 ， 监 理 和 助理 应 该 不 能 访问 Staff 基 本 表 。 即 
应 该 给 他 们 授予 对 Staff1_View 视 图 的 访问 权限 ， 由 此 来 拒绝 他 们 对 敏感 的 工资 数据 的 访问 权 
限 。 我 们 将 在 步骤 7.3 进 一 步 讨 论 访问 权限 。 

2. 在 Microsoft Access 2002 中 创建 视图 

Microsoft Access 不 支持 SQL CREATE VIEW 语句 。 取 而 代 之 ， 你 可 以 使 用 QBE 或 SQL 来 
创建 (存储 ) 查询 。 例 如 ， 可 以 使 用 QBE 查 询 创建 Stafftl _View 视 图 ， 如 图 14-2a 所 示 ， 或 者 使 
用 如 图 14-2b 所 示 的 SQL 语句 。 -这 个 查询 现在 可 以 用 于 创建 其 他 的 查询 ; 或 者 插入 /更 新 /删除 
基本 表 Staff 中 的 记录 ， 并 且 可 以 作为 创建 窗 体 和 报表 的 基础 。 





ET Staffl_ View : Select Query 


SELECT staffno, name, position 


= Staffl_ View : Select Quecry 


FROM staff 
ERE branchno = ‘B01’; 





b) 使 用 SQL 





a) 使 用 QBE 
图 14-2 在 Microsoft Access 中 创建 ( 存储 ) 查询 


14.2 步骤 6: 设计 安全 性 机 制 


目标 为 数据 库 设 计 在 数据 库 应 用 生命 周期 的 需求 收集 和 分 析 阶 段 用 户 指定 的 安全 
机 制 。 


一 个 数据 库 代 表 了 重要 的 公司 资源 ， 因 此 其 安全 性 是 非常 重要 的 。 在 数据 库 应 用 生命 周 
期 的 需求 收集 和 分 析 阶 段 可 能 已 经 记录 了 安全 需求 ， 本 步骤 的 目的 是 决定 如 何 实现 这 些 安全 
性 需求 。 不 同 的 DBMS 提 供 的 安全 性 功能 略 有 差别 ， 因 此 你 必须 知道 目标 DBMS 提 供 的 安全 机 
制 。 正 如 我 们 在 第 5 章 讨论 的 ， 关 系 DBMS 通 常 提供 两 种 类 型 的 数据 库 安全 : 

“系统 安全 

“数据 安全 

系统 安全 包括 系统 级 的 数据 库 访问 和 使 用 ， 例 如 ， 用 户 名 和 口令 。 数 据 安全 包括 数据 库 
对 象 的 访问 和 使 用 (例如 表 和 视图 ) 以 及 用 户 在 这 些 对 象 上 的 可 执行 操作 
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为 了 说 明 设 计 访 问 规 则 的 过 程 ， 我 们 介绍 了 两 种 设计 安全 性 机 制 使 用 的 两 个 特定 方法 : 
。1999 ISO SQL 标准 (SQL3 ) 
。 Microsoft Access 2002 





在 第 18 章 中 ， 我 们 将 使 用 一 个 不 同 的 工作 例子 ， 来 说 明 如 何在 Oracle 9i 中 设计 安全 性 机 制 。 


1. 1999 ISO SQL 标准 (SQL3 ) 

提供 数据 安全 性 的 一 种 方法 是 使 用 SQL 的 访问 控制 功能 。 正 如 我 们 刚刚 提 到 的 ， 通 常情 
况 下 ， 用 户 不 应 该 获得 直接 访问 基本 表 的 权限 ， 而 是 要 通过 步骤 5 所 设计 的 用 户 视图 来 访问 基 
本 表 。 这 提供 了 很 大 程度 上 的 数据 独立 性 并 避免 了 用 户 受 数据 库 结构 变化 的 影响 。 我 们 简单 
地 回顾 SQL 的 访问 控制 机 制 。 对 于 更 详细 的 信息 ， 有 兴趣 的 读者 可 参阅 Connolly 和 Begg 
(2002) 的 著作 。 . | 

每 个 数据 库 用 户 都 由 数据 库 管理 员 (DBA) 分 配 一 个 认证 标识 ， 出 于 明确 的 安全 原因 、 
通常 情况 下 ， 此 标识 都 有 一 个 相关 的 口令 。DBMS 执 行 的 每 个 SQL 语 句 都 代表 了 一 个 具体 的 
用 户 操 作 。 认 证 标识 被 用 来 确定 用 户 可 以 引用 的 对 象 和 可 以 对 这 些 对 象 执行 的 操作 。SQL 中 
创建 的 每 个 对 象 都 有 一 个 拥有 者 ， 它 是 由 认证 标识 标志 的 。 默 认 情 况 下 ， 这 个 对 象 拥有 者 是 
唯一 知道 该 对 象 的 存在 并 且 可 以 对 该 对 象 执行 全 部 操作 的 人 。 

权限 (Privilege) 是 允许 用 户 对 一 给 定 的 基本 表 或 视图 可 执行 的 操作 。 例 如 ，SELECT 是 
从 表 中 检索 数据 的 权限 ，UPDATE 是 更 新 表 中 记录 的 权限 。 当 用 户 使 用 SQL CREATE TABLE 
语句 创建 表 时 ,他 (她 ) 自动 成 为 该 表 的 拥有 者 ， 并 拥有 该 表 的 所 有 权限 。 其 他 用 户 在 最 初 
并 不 拥有 这 个 新 创建 的 表 的 任何 权限 。 表 拥有 者 必须 明确 使 用 SQL GRANT 语句 授予 他 们 必须 
的 权限 ， 使 他 们 有 权 访 问 此 表 。WITH GRANT OPTION 子 句 说 明 允 许 获 得 权限 的 用 户 将 该 权 
限 授 予 别人 。 可 以 用 SQL REVOKE 语 句 收回 权限 。 

当 用 户 用 CREATE VIEW 语句 创建 一 个 视图 后 ， 他 〈 她 ) 自动 成 为 此 视图 的 拥有 者 ， 但 并 
没有 获得 此 视图 的 全 部 权限 。 要 创建 视图 ， 用 户 必 须 有 对 组 成 视图 的 表 的 SELECT 权 限 。 但 拥 
有 者 将 仅 获 得 他 所 拥有 的 视图 中 的 表 的 其 他 权限 。 

例如 ， 人 允许 用 户 MANAGER 检 索 Staff 表 中 的 记录 ， 并 且 可 以 对 Staff 表 进行 插入 、 更 新 和 
删除 的 操作 ， 可 以 使 用 如 下 SQL 语句 : 

GRANT ALL PRIVILEGES 

ON Staff 

TO Manager WITH GRANT OPTION; 

这 时 ， MANAGER 将 也 可 以 引用 此 表 和 它 随 后 所 创建 的 表 中 的 金 部 列 。 子 句 WITH 
GRANT OPTION 说 明 MANAGER 能 将 这 些 权 限 授予 其 他 它 认为 合适 的 用 户 。 另 一 个 例子 是 给 
认证 标识 为 ADMIN 的 用 户 用 如 下 SQL 语句 授予 Staff 表 的 SELECT 权限 : 

GRANT SELECT 


ON Staff 
TO Admin; 


这 条 语句 省 去 了 子 句 WITH GRANT OPTION， 所 以 ADMIN 不 能 将 该 权限 再 授 给 其 他 用 


2. Microsoft Access 2002 中 的 安全 性 
Microsoft Access 2002 不 支持 SQL GRANT 和 REVOKE 语 句 。 作 为 替换 ， Access 为 数据 库 
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安全 提供 如 下 两 种 方法 : 

。 为 打开 数据 库 设置 口令 (系统 安全 ) 。 

。 用 户 级 安全 ， 用 来 限制 用 户 可 以 读 和 更 新 的 数据 库 部 分 (数据 安全 )。 

(1) 设置 口令 

更 简单 的 打开 数据 库 的 方法 是 设置 一 个 口令 。 一 旦 设置 了 口令 (从 Tools 中 的 Security 菜 单 ) ， 
当 打开 数据 库 时 ， 都 会 弹出 要 求 日 令 的 对 话 框 。 此 对 话 框 用 来 设置 口令 和 在 打开 数据 库 时 要 
求 用 户 输 入 口令 ， 如 图 14-3 所 示 。 


Set Database Password 





该 对 话 框 用 来 设置 密 








码 以 控制 对 数据 库 的 ee 
访问 (密码 不 显示 在 
屏幕 上 ) 
a) Set Database Password 对 话 框 b) 在 启动 时 显示 的 Password 对 话 框 


14-3 用 口令 使 StayHome 数 据 库 安全 


只 有 输入 了 正确 口令 的 用 户 ， 才 人 允许 打开 数据 库 。 由 于 Microsoft Access 将 口令 进行 了 加 
密 ， 因 此 该 方法 是 很 安全 的 ， 所 以 不 能 通过 直接 读 取 数 据 库 文件 的 方法 来 访问 数据 库 。 但 是 ， 
一 旦 打开 数据 库 ， 数 据 库 所 包含 的 所 有 对 象 对 用 户 就 都 是 可 用 的 。 | 

(2) 用 户 级 安全 

Microsoft Access 中 的 用 户 级 安全 与 大 多 数 网 络 系统 中 使 用 的 方法 很 相似 。 当 开 始 使 用 
Microsoft Access 时 ， 要 求 用 户 标识 自身 并 输入 口令 。 在 工作 组 信息 文件 中 ， 用 户 被 标识 》 
组 (group) 的 成 员 。 访 问 提供 两 个 默认 组 : 管理 员 (Admins 组 ) 和 用 户 (Users 组 ) ， 但 是 
你 也 可 以 定义 其 他 的 组 。 图 14-4 显 示 了 为 用 户 和 组 账号 定义 安全 等 级 的 对 话 框 。 它 显 示 了 
非 默 认 的 组 ， 称 为 Assistants ， 以 及 一 个 叫做 Assistant 的 用 户 ， 他 是 Users 和 Assistants 组 的 
成 员 。 

许可 (Permission ) 被 授 给 组 和 用 户 来 规定 用 户 对 数据 库 中 的 对 象 可 以 进行 的 操作 ， 许可 
可 以 使 用 User and Group Permissions 对 话 框 实现 。 表 14-1 说 明 了 在 Microsoft Access 中 可 以 设 
置 的 许可 。 例 如 ， 图 14-5 说 明了 一 个 叫做 Assistant 的 用 户 在 StayHome 中 只 有 读 Staffl_View 的 
权限 。 类 似 的 情况 是 ， 所 有 对 基本 表 Staff 的 访问 权限 均 被 删除 了 ， 因此 ，Assistant 用 户 只 可 
以 使 用 这 个 视图 来 浏览 Staff 表 中 的 数据 。 

3. Microsoft Access 的 其 他 安全 特性 
除了 前 面 介绍 的 两 个 Microsoft Access 数 据 库 安全 方法 之 外 ， 其 他 的 安全 性 特性 包 
括 : 
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Assistant 用 户 是 Users 和 


已 经 设置 了 非 默 Assistants 组 的 一 个 成 员 


认 的 Assistants 组 








Assistant 只 用 来 访问 
Staff 1_View 





图 14-5 User and Group Permissions 对 话 框 表明 Assistant 用 户 只 有 读 Staff 1_View 的 权限 


* 加 密 /解密 对 数据 库 加 密 以 压缩 一 个 数据 库 文件 ， 并 使 它 不 会 被 某 个 实用 工具 或 文字 
处 理 软件 破译 出 来 。 如 果 你 希望 传递 一 个 数据 库 或 希望 将 数据 库存 储 在 一 个 软盘 或 压缩 
磁盘 上 时 ， 这 个 技术 非常 有 用 。 解 密 数 据 库 是 加 密 的 逆 过 程 。 

表 14-1 Microsoft Access 许可 


一 


许 可 说 “ 明 





| 
Open/Run 打开 数据 库 、 窗 体 、 报 表 或 运行 一 个 宏 
Open Exclusive 用 排他 访问 方法 打开 一 个 数据 库 
Read Design 在 Design 视 图 中 浏览 对 象 
Modify Design 浏览 和 更 改 数据 库 对 象 ， 并 删除 它们 
Administer “对 于 数据 库 ， 设 置 数据 库 口 令 、 复 制 数据 库 以 及 更 改 启动 属性 。 完 全 访 
问 数据 库 对 象 包括 分 配 许可 的 能 力 
Read Data 浏览 数据 
Update Data 浏览 和 更 改 数据 (但 不 能 插入 或 删除 数据 ) 
Insert Data 浏览 和 插入 数据 (但 不 能 更 改 或 删除 数据 ) 


Delete Data 浏览 和 删除 数据 (但 不 能 插入 或 更 改 数据 ) 
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“防止 用 户 复制 数据 库 、 设 置 密码 或 设置 启动 选项 。 

* 安全 性 VBA 代 码 : 可 通过 每 当 进 入 一 个 会 话 时 设置 一 个 密码 来 获得 此 功能 ， 或 者 通过 将 
数据 库 文件 保存 为 MDE 文 件 来 实现 安全 性 VBA 代 码 ， 这 种 形式 的 文件 在 从 数据 库 中 删 
除 它 之 前 编译 这 个 VBA 源 代码 。 将 数据 库 保存 为 一 个 MDE 文 件 也 防止 了 用 户 修改 窗 体 
和 报表 ， 而 不 用 指定 登录 密码 和 设置 用 户 级 安全 。 

将 用 户 视图 和 安全 措施 存档 

每 个 用 户 视图 和 所 关联 的 安全 机 制 的 设计 都 应 该 全 部 存档 。 如 果 物 理 设 计 影响 了 逻辑 数 

据 模型 ， 那 么 应 该 更 新 这 些 模型 。 . 


14.3 本 章 小 结 


“数据 库 实际 上 代表 了 公共 的 资源 ， 所 以 该 资源 的 安全 机 制 是 极为 重要 的 。 

" 在 步骤 5 中 ， 确 定 如 何在 目标 DBMS 中 实现 每 个 用 户 视图 。 

“ 在 步骤 6 中 ， 确 定 在 需求 收集 和 分 析 阶 段 如 何 标 识 将 在 目标 DBMS 中 实现 的 安全 性 措施 ， 
包括 对 基本 表 的 访问 控制 。 . 

“关系 DBMS 通 常 提供 两 种 类 型 的 数据 库 安 全 : 系统 安全 和 数据 安全 。 系 统 安全 包括 系统 
级 的 数据 库 访问 和 使 用 ， 例 如 ， 用 户 名 和 口令 。 数 据 安全 包括 数据 库 对 象 的 访问 和 使 用 
(例如 表 和 视图 ) 以 及 用 户 在 这 些 对 象 上 拥有 的 可 执行 操作 。 


复习 题 


14.1 描述 本 章 介绍 的 物理 数据 库 设 计 方 法 学 的 主要 步骤 的 目的 。 
14.2 讨论 系统 安全 和 数据 安全 的 区 别 。 

14.3 描述 SQL 的 访问 控制 功能 。 

14.4 描述 Microsoft Access 2002 的 安全 特性 。 


练习 


14.5 按 你 的 方式 用 附录 E 中 给 出 的 一 些 案例 研究 进行 练习 ， 对 你 访问 的 DBMS 应 用 在 本 
章 中 讨论 的 物理 设计 方法 学 中 的 步 又 。 创建 你 认为 合适 的 用 户 视图 以 及 安全 性 机 制 ， 
证 明 你 选择 的 用 户 视图 和 安全 性 机 制 是 正确 的 。 
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本 章 主 题 : 

。 反 规范 化 的 含义 。 

。 何 时 利用 反 规 范 化 来 改善 系统 性 能 。 

本 章 介绍 数据 库 设 计 方 法 学 中 的 步 双 7。 在 前 边 的 三 章 中 ， 我 们 将 逻辑 设计 转换 为 一 组 表 
和 业务 规则 ， 并 基于 对 数据 库 必 须 支 持 的 事务 的 分 析 ， 为 表 选 择 合适 的 文件 组 织 方 式 和 索引 。 
然后 我 们 决定 如 何 实现 用 户 视图 以 及 如 何 实现 数据 库 安 全 。 在 某 些 情 况 下 ， 通 过 放宽 规范 化 
的 要 求 可 以 改善 性 能 ， 这 就 是 本 章 要 讨论 的 内 容 。 


15.1 步骤 7: 引入 受 控 宛 余 的 考虑 
目标 确定 是 否 放松 规范 化 规则 引入 受 控 宛 余 数据 来 改善 系统 性 能 。 


规范 化 是 确定 哪些 列 属于 同一 张 表 的 技术 。 关 系数 据 库 设计 的 基本 目的 之 一 就 是 对 列 进 
行 分 组 ， 并 组 织 到 表 中 ， 因 为 它们 之 间 有 直接 关系 〔 称 为 函数 依赖 ， 见 8.4 节 )。 在 数据 上 实 
现 规范 化 的 结果 就 是 逻辑 数据 库 设 计 ， 它 是 结构 上 一 致 的 和 最 小 元 余 的 。 

但 是 , 规范 化 的 数据 库 设 计 可 能 不 能 提供 最 大 的 处 理 效率 。 这 时 ， 你 可 能 愿意 接收 规范 化 设 
计 方 面 的 一 些 损失 而 实现 更 好 的 性 能 。 当 估计 系统 不 能 满足 所 需要 的 性 能 时 ， 应 该 只 考虑 这 点 。 


我 们 不 提 介 将 规范 化 从 还 辑 数据 库 设计 中 省 略 : 规范 化 迫使 你 完整 地 理解 数据 库 
中 每 个 表 的 每 个 列 。 着 手 于 这 一 步 ， 可 能 是 整个 系统 成 功 的 最 重要 的 因素 。 如 果 考 虑 
反 规 范 化 ， 则 下 述 因素 必须 要 考虑 : 

。 反 规范 化 使 实现 更 加 复杂 。 

。 反 规范 化 经 常会 牺牲 灵活 性 。 . 
“ 反 规 范 化 可 能 加 快 检索 速度 ， 但 会 降低 更 新 速度 。 


通常 ， 术 语 “ 反 规范 化 ”是 指 对 基本 表 结构 的 修改 ， 使 得 新 表 比 原始 表 的 范式 低 。 但 是 ， 
我 们 也 更 宽泛 地 使 用 这 个 术语 来 指 我 们 将 两 个 表 合成 一 个 新 表 的 情况 ， 该 新 表 与 原 表 满 足 相 
同 范式 但 比 原始 表 包 含 更 多 的 空 值 。 


提示 通常 ， 如 果 性 能 达 不 到 要 求 ， 并 且 表 的 更 新 率 较 低 ， 查询 率 较 高 ， 则 反 规 范 化 就 
是 可 行 的 。 


在 步 又 4.1 搞 述 的 事务 / 表 的 交叉 引用 和 矩阵 为 这 步 提 供 了 有 用 的 信息 。 该 矩阵 以 可 视 化 方式 
总 结 出 数据 库 中 运行 的 事务 的 访问 模式 。 可 以 使 用 它 来 强调 可 能 的 反 规范 化 的 候选 并 评价 这 
种 方法 对 模型 其 他 部 分 的 影响 。 在 处 理 地 址 时 ， 你 已 经 遇 到 了 反 规 范 化 的 一 个 隐 式 的 例子 。 
例如 ， 考 虑 Branch 表 的 定义 : 


Branch (hranchNo, street, city, state, zipCode, mgrStaffNo) 
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严格 地 说 ， 该 表 并 不 满足 第 三 范式 : zipCode 函 数 决定 了 city 和 state。 换 句 话说 ， 如 果 知 
道 了 邮政 编码 ， 那 么 也 就 可 以 知道 城市 和 州 。 因 此 ， 规 范 化 该 表 ， 把 该 表 一 分 为 二 是 必要 的 ， 
如 下 所 示 : 

Branch (branchNo, street, zipCode, mgrStaffNo) 

ZipCode (zipCode, city, state) 

但 是 ， 你 很 少 会 希望 访问 分 公司 地 址 的 时 候 ， 没 有 城市 和 州 这 两 列 。 这 就 意味 着 当 想 得 
到 完全 的 地 址 时 ， 将 不 得 不 执行 连接 。 所 以 ， 我 们 通常 实现 原始 的 Branch 表 并 且 满 足 第 二 范 
式 (2NF )。 

但 是 ， 没 有 固定 的 规则 来 决定 何 时 对 表 反 规范 化 。 让 我 们 来 看 看 反 规 范 化 的 更 通常 的 情 
况 ， 以 便 加 速 进行 常用 或 关键 的 事务 : 

“步骤 7.1: 合并 一 对 一 (1 : 1) 关系 。 

“步骤 7.2: 复制 一 对 多 (1 : *) 关系 中 的 非 键 列 来 减少 连接 。 

“步骤 7.3: 复制 一 对 多 (1 : *) 关系 中 的 外 键 列 来 减少 连接 。 

“步骤 7.4: 复制 多 对 多 (* : *) 关系 中 的 列 来 减少 连接 。 

“步骤 7.5: 引入 重复 组 。 

“步骤 7.6: 创建 提取 表 。 

“步骤 7.7: 分 区 表 。 

1. 步骤 7.1: 合并 一 对 一 (1 : 1) 关系 

重新 检查 一 对 一 (1 : 1) 关系 来 确定 将 表 合 并 成 一 个 表 的 效果 。 应 该 只 考虑 将 经 常 引用 
的 和 不 经 常 引 用 的 表 分 开 。 让 我 们 考虑 Staff 和 NOK 之 间 的 潜在 1 : 1 关系 (1 : 1 关系 定义 参 
见 7.5.1 节 )， 如 图 15- 志 所 示 。Staff 实 体 包含 关于 员工 的 信息 ， NOK 实 体 包含 员工 的 近亲 的 
信息 。 






staffNo {PK} 
name 
position 
salary 
nokName 和 nokTelNo nokName 
列 集成 到 Staff 中 asi 
b) 修正 后 的 表 





518-474-5355 





来 自 最 初 的 NOK 





0) 结果 表 来 自 最 初 的 Staff 
图 15-1 Staff 和 NOK 
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我 们 可 将 这 两 个 表 合 并 在 一 起 ， 如 图 15-1b 所 示 。Staff 和 NOK 之 间 的 关系 是 1:1 的 ， 并 且 
参与 是 可 选 的 。 由 于 参与 是 可 选 的 ， 所 以 当 将 两 个 表 合 并 在 一 起 的 时 候 ， 一 些 列 的 一 些 记 录 
出 现 了 空 值 ， 如 图 15-1c 所 示 。 如 果 Staff 表 很 大 ， 包 含 在 该 参与 中 的 该 部 分 的 记录 的 比例 很 小 ， 
那么 会 有 很 大 数量 的 空间 浪费 。 因 此 空间 的 浪费 就 不 得 不 与 合并 表 所 带 来 的 性 能 的 提高 进行 
权衡 了 。 

2. 步骤 7.2: 复制 一 对 多 (1:*) 关系 中 的 非 键 列 来 减少 连接 

为 了 减少 或 删除 经 常 性 或 关键 性 查询 的 连接 ， 在 一 对 多 关系 中 ， 应 该 考虑 在 子 表 中 复制 
一 个 或 更 多 的 父 表 中 的 非 键 列 的 益处 。 例 如 ， 当 访问 表 VideoForRent 时 ， 通 常会 同时 访问 录 
像 带 的 日 租金 率 。 典 型 的 SQL 查询 语句 是 : 


SELECT vfr.*, v.dailyRental 

FROM videoForRent vfr ,Video v 

WHERE vfr.catalogNo = v.catalogNo 
AND branchNo = 'B001'; 


初始 的 表 如 图 15-2a 所 示 。 

如 果 复 制 VideoForRent 表 中 的 dailyRental 列 ， 那么 就 可 以 在 查询 中 不 涉及 Video 表 ，SQL 
语句 如 下 : 

SELECT vfr.* 


FROM VideoForRent vfr 
WHERE branchNo = 'B0O01'; 


修正 后 的 VideoForRent 表 如 图 15-2 所 示 。 


VideoForRent 


videoNo {PK} 
available 


















VideoForRent 


videoNo {PK} 
available 








catalogNo {PK} 


catalogNo {PK} 
title i 


title 






category catalogNo {FK} Category dailyRental 
dailyRental branchNo {FK} dailyRental catalogNo {FK} 
Pprice price branchNo {FK} 






directorNo {FK} 


directorNo {FK} 





dailyRentai 列 在 
、 VideoForRent 中 重复 
习 最初 的 表 b) 修订 后 的 表 


图 15-2 Video 和 VideoForRent 


这 种 变化 的 益处 与 它 产 生 的 问题 是 相对 的 。 例 如 ， 如 果 修 改 了 父 表 中 的 复制 数据 ， 则 必 
须 在 子 表 中 也 更 新 它 。 另 外 ， 对 1:* 关 系 来 说 ， 在 子 表 中 每 个 数据 项 有 可 能 多 次 出 现 。 因 此 ， 
你 也 必须 要 维护 多 份 拷贝 的 一 致 性 。 如 果 Video 和 VideoForRent 表 的 dailyRental 列 不 能 自动 更 
新 ， 则 要 考虑 潜在 的 完整 性 的 丢失 。 即使 这 个 过 程 可 以 是 自动 的 ， 但 在 每 次 插入 、 更 新 或 删 
除 记录 的 时 候 ， 为 了 保持 完整 性 也 需要 花费 额外 的 时 间 。 在 我 们 的 例子 中 ， 当 录像 带 变 旧 的 
时 候 ， 可 能 日 租金 率 会 降低 ， 所 以 复制 可 能 是 没有 保证 的 。 

要 考虑 的 另 一 个 问题 是 由 于 复制 而 占用 的 存储 空间 的 增长 。 不 过 ， 现 在 辅助 存储 器 相对 
价格 较 低 ， 这 可 能 是 个 小 问题 。 但 这 并 不 是 任意 复制 的 理由 。 


提示 ”一 对 多 (1:*) 关系 的 一 个 特殊 例子 是 查找 表 ， 有 了 时 也 称 为 引用 表 或 挑选 列表 。 





得 所 需 的 分 公司 号 一 一 branchNo。 
连接 。 也 就 是 ， 在 Branch 和 Rental 
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通常 ， 查 找 表 包含 一 段 代 码 和 一 个 描述 。 例 如 ， 可 以 为 录像 类 别 定义 一 个 查找 表 并 修 
改 它 ， 该 表 如 图 15-3a 所 示 。 如 果 这 个 查找 表 经 常 使 用 ， 或 者 是 关键 的 查询 ， 而 且 描 述 
可 能 不 变化 ， 则 考虑 在 子 表 中 复制 该 description 列 ， 如 图 15-3b 所 示 。 原 始 的 查找 表 不 是 
多 余 的 ， 它 仍 可 用 于 验证 用 户 的 输入 。 但 是 ， 通 过 将 description 列 复制 到 子 表 中 ， 就 不 
必 将 查找 表 与 子 表 进 行 连接 。 

使 用 查找 表 的 优点 包括 : 

"降低 了 子 表 (在 这 里 ， 是 Video 表 ) 的 大 小 ， 分 类 代码 占 1 字 节 ， 而 分 类 描述 占 8 字 
了 。 

* 如 果 描 述 可 以 修改 (这 不 是 这 个 特例 的 情形 )， 在 查找 表 (VideoCategory) 中 只 需 
修改 一 次 ， 而 在 子 表 (Video) 中 就 要 修改 多 次 。 

。 查找 表 可 用 于 验证 用 户 的 输入 。 


VideoCategory 


CategoryFor > 
categoryID {PK} 


description 


















catalogNo {PK} 
title 
categoryID {FK} 
dailyRental 
Price 
directorNo {FK} 










a) 原始 表 





VideoCategory 


CategoryFor > 
categoryID {PK} 


description 











catalogNo {PK 
title ， 
categoryID {FK} 
description 
dailyRental 
Price 
directorNo {FK} 








在 Video 中 有 重复 
的 description 列 


b) 修正 后 的 表 
图 15-3 录像 分 类 的 查找 表 
3. 步骤 7.3: 复制 一 对 多 (1 : *) 关系 中 的 外 键 列 来 减少 连接 






同样 ， 为 了 减少 或 删除 常用 或 关键 查询 的 连接 ， 应 该 考虑 复制 关系 中 一 个 或 更 多 个 外 键 列 的 
好 处 。 例 如 ，StayHome 的 一 个 常用 查询 是 列 出 每 个 分 公司 的 所 有 租借 协议 ， 使 用 的 SQL 语句 如 下 : 


SELECT ra.* 
FROM RentalAgreement ra VideoForRent vfr 
WHERE ra.videoNo=vfr.videoNo AND vfr .branchNo='Bool'; 


初始 表 如 图 15-4a 所 示 。 


正如 从 这 个 查询 中 所 看 到 的 ， 为 了 得 到 租借 协议 的 列表 ， 必须 使 用 VideoForRent 表 来 获 


询 简化 为 : 





SELECT * 


可 以 在 RentalAgreement 表 中 复制 外 键 列 branchNo 来 消除 
Agreement 表 之 间 引 入 直接 的 关系 。 这 时 ， 可 以 将 SQL 查 
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FROM RentalAgreement 
WHERE branchNo = 'B001'，; 


修正 的 表 如 图 15-4b 所 示 。 如 果 确 实 有 变化 ， 引 入 额外 的 外 键 约束 是 很 必要 的 ， 如 步骤 2.3 


中 所 讨论 的 。 

videoNo {PK} … 。 p 

branchNo {FK} branchNo {PK} 
1..1 


IsPartOf 


了 QO..* 


rentalNo {PK)} 
videoNo {FK} 


a) 初始 表 




























videoNo {PK} 的 “ 
branchNo {FK} branchNo {PK} 
1..1 1..1 
IsPartOf ParticipatesIn 
了 0..* v 额外 添加 的 关系 
rentalNo {PK} 
videoNo {FK} 






添加 外 键 作为 


branchNo {FK)} 新 关系 的 结果 





b) 修正 后 的 表 


图 15-4 RentalAgreement 和 VideoForRent 


注意 。 Branch 和 RentalAgreement 之 间 的 新 关系 是 1 : * 的 。 换 向 话说 ， 对 任何 租借 协议 
来 说 ， 有 并 且 只 有 一 个 与 之 相 联 的 分 公司 。 如 果 关 系 是 多 对 多 的 ， 那 么 上 面 的 变化 将 
不 能 正常 工作 。 例 如 ， 另 一 个 常用 查询 可 能 是 列 出 一 个 分 公司 中 存储 的 录像 带 的 标题 ， 
使 用 如 下 SQL 查询 : 

SELECT v.title 


FROM Video v VideoForRent vfr 
WHERE Vv.catalogNo=vfr.catalogNo AND vfr.branchNo = 'B001'; 


该 查询 不 能 简单 地 为 Video 表 增加 branchNo 列 ， 因为 Branch 和 Video 之 间 的 关系 是 上 : * 
的 ， 也 就 是 说 ， 一 个 录像 带 标题 被 许多 分 公司 所 存储 ， 一 个 分 公司 也 有 许多 录像 带 标 
题 。 但 是 ， 这 时 你 可 能 会 考虑 在 VideoForRent 表 中 ， 复制 Video 表 的 title 列 ， 尽 管 这 时 会 
增加 存储 ， 但 在 这 里 可 能 是 很 有 效 的 。 
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4. 步骤 7.4: 复制 多 对 多 (* : *) 关系 中 的 列 来 减少 连接 
在 步 又 2.1 中 ， 将 每 个 * : * 关 系 映射 为 三 张 表 : 两 个 从 原始 实体 派生 的 表 和 一 个 表达 两 个 
实体 间 关 系 的 新 表 。 现 在 ， 如 果 你 希望 从 * : * 关 系 中 产生 信息 ， 则 必须 要 连接 这 三 个 表 。 有 
时 ， 在 中 间 表 中 ， 可 以 复制 初始 实体 中 的 列 来 减少 要 被 连接 的 表 的 数量 。 
例如 ，Video 和 Actor 之 间 存 在 * : * 关 系 ，Role 作 为 中 间 实 体 。 考 虑 列 出 录像 带 标题 和 每 个 


演员 扮演 的 角色 的 查询 : 
SELECT Vv.title,a.*,r.* 
FROM Video v , Role r, Actor a 
WHERE v.catalogNo=r.catalogNo AND r. actorNo-=a, actorNo; 


基于 表 的 图 如 图 15-5a 所 示 。 
se | ry 


catalogNo {PK/FK) | 1 1..1 
actorNo {PK/FK)} 
character 








Actor 


actorNo {PK} 
actorName 
























catalogNo {PK} 
title 

category 
dailyRental 
price 
directorNo 




















a) 最 初 的 表 


actorNo {PK} 
actorName 


Video 表 的 title 列 在 
Role 表 中 复制 











1..1 








catalogNo {PK/FK} | 1..* 
actorNo {PK/FK} 
character 
title 


catalogNo {PK} 
title . 
Category 
dailyRental 
Price 
directorNo 






b) 修正 后 的 表 


图 15-5 Video、Actor 和 Role 


如 果 在 Role 表 中 复制 title 列 ， 则 可 以 在 查询 中 删除 Video 表 ， 修正 后 的 SQL 查询 如 下 : 
SELECT a.*,r.* 

FROM Role r , Actor a 

WHERE r.actorNo = a.actorNo; 

修正 后 的 表 如 图 15-5b 所 示 。 

5. 步骤 7.$: 引入 重复 组 


为 了 达到 所 有 实体 都 满足 第 一 范式 (1NF) 的 要 求 ， 应 该 从 逻辑 数据 模型 中 删除 重复 组 。 
重复 组 被 分 离 到 新 表 中 ， 与 初始 表 ( 父 表 ) 一 起 形成 1:* 关 系 。 有 时 ， 再 次 引入 重复 组 是 提高 


系统 性 能 的 很 有 效 的 方法 。 


例如 ， 每 个 StayHome 分 公司 的 办 公 室 最 少 有 一 个 最 多 有 三 个 电话 号 码 。 在 逻辑 数据 模型 


中 ,创建 了 与 Branch 实 体 有 三 对 一 (3:1) 关系 的 Telephone 实 体 。 如 图 15-6a 所 示 。 


如 果 对 这 些 信 息 的 访问 是 重要 的 和 经 常 的 ， 那么 合并 表 并 在 初始 的 Branch 表 中 存储 电话 


的 详细 信息 可 能 会 更 有 效 。 在 这 里 ， 每 个 电话 号 码 用 一 个 列 存储 ， 如 图 15-6b 所 示 。 
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branchNo {PK telNo {PK} 
Pm" branchNo {FK} 


street 









branchNo {PK} - 
street 


Provides > 























5 city 
SE state 
zipCode TelNo 列 在 Branch 中 i 
mBrStafiNo 复制 ， 至 少 有 一 个 电 _ | telNo2 
a) 最 初 的 表 话 号 玛 (作为 AK ) ， telNo3 
其 他 是 可 选 的 mgrStaffNo 
b) 修正 后 的 表 


图 15-6 Branch 和 Telephone 


通常 ， 在 如 下 情况 下 ， 应 该 只 考虑 这 种 类 型 的 反 规 范 化 : 

“ 重复 组 中 项 的 绝对 数量 是 已 知 的 (在 本 例 中 ,是 三 个 电话 号 码 的 最 大 值 )。 

“该 数量 是 静态 的 ， 并 且 随 着 时 间 的 流逝 ， 不 会 发 生 改 变 (StayHome 已 经 固定 了 分 公司 

中 电话 线 的 最 大 数量 ， 并 且 不 想 发 生 改 变 )。 

* 该 数量 并 不 是 很 大 ， 通 常 不 大 于 10， 尽 管 这 不 像 前 两 个 条 件 那么 重要 。 

有 时 ， 在 重复 组 中 只 存储 最 近 的 和 当前 的 值 ， 或 者 只 是 有 重复 组 ， 因 为 它 是 最 经 常 使 用 
的 。 在 前 面 的 例子 中 ， 你 可 能 选择 在 Branch 表 中 存储 一 个 电话 号 码 ， 而 让 其 他 的 电话 号 码 存 
储 在 Telephone 表 中 ， 这 将 删除 Branch 表 中 的 空 值 ， 因 为 每 个 分 公司 必须 至 少 有 一 个 电话 号 码 。 

6. 步骤 7.6: 创建 提取 表 

可 能 有 这 样 的 情况 ， 你 不 得 不 在 每 天 峰值 的 时 候 运行 某 种 报表 。 这 些 报表 要 访问 派生 数 
据 并 且 基于 相同 的 一 组 基本 表 执 行 多 表 连 接 。 但 是 ， 报 表 所 基于 的 数据 可 能 是 静态 的 ， 或 者 
有 时 并 不 需要 当前 的 数据 (也 就 是 ， 如 果 数 据 已 经 存在 几 个 小 时 了 ， 产生 的 报表 可 能 会 更 好 )。 
这 时 ， 可 能 需要 创建 一 张 基于 报表 所 需要 的 表 的 反 规范 化 的 提取 表 ， 并 且 允 许 用 户 直 接 访 问 
提取 表 代 替 访 问 基本 表 。 生 成 提取 表 的 最 常用 的 技术 是 在 系统 使 用 最 少 的 时 候 ， 在 前 一 天 晚 
上 批 运行 时 创建 和 生成 这 些 表 。 

7. 步骤 7.7: 分 区 表 

除了 将 表 合并 在 一 起 之 外 ， 还 有 另外 一 个 方法 用 于 解决 非常 大 的 表 (和 索引 ) 的 关键 问 
题 ， 这 个 方法 就 是 将 表 分 解 成 一 些 较 小 的 并 且 更 易于 维护 的 片断 ， 称 为 分 区 (partition)。 如 
图 15-7 所 示 ， 有 两 种 主要 类 型 的 分 区 。 





图 15-7 水 平分 区 和 垂直 分 区 
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水 平分 区 (Horizontal Partitioning ) 将 表 中 的 记录 分 布 在 几 个 较 小 的 表 中 。 


垂直 分 区 (Vertical Partitioning ) 将 表 中 的 列 分 布 在 一 些 较 小 的 表 中 (主键 是 被 复制 


的 ， 以 便 重 构 原始 表 )。 


分 区 在 存储 和 分 析 大 数量 的 数据 的 应 用 中 非 党 有用。 例如， 假设 VideoForRent 表 中 存储 几 
十 万 条 记录 ， 以 便 进行 各 种 分 析 。 在 一 个 分 公司 中 查找 某 个 特定 记录 可 能 是 相当 耗 时 间 的 ; 
但 我 们 可 以 通过 水 平分 区 这 个 表 来 减少 查找 时 间 ， 使 每 个 分 公司 占用 一 个 分 区 。 在 Oracle 中 可 
以 使 用 如 图 15-8 所 示 的 SQL 语 句 为 这 个 场景 创建 一 个 ( 哈 希 ) 分 区 。 


CREATE TABLE VideoForRent_Pcatition( 
VideoNo CHARO) NOT NULL， 
available CHAR NOT NULL. 
catalogNo CHAR(6) NOT NULL. 
bronchNo CHARC4) NOT NULL. 
PRIMARY KEY videoNo. 
FOREIGN KEY catalogNo REFERENCES 
Video(videoNo), 





FOREIGN KEY brcmchNo REFERENCES 
Branch(bronchNo)) 

PARTITION BY HASH (bromchNo) 

(PARTITION bl TABLESPACE TBO!], 

PARTITION b2 TABLESPACE TBO2, 

PARTITION b3 TABLESPACE TB03， 

PARTITION b4 TABLESPACE TBO4); 





图 15-8 创建 ( 哈 希 ) 分 区 的 Oracle SQL 语句 


和 哈 希 分 区 一 样 ， 常 见 的 分 区 还 有 范围 分 区 (每 个 分 区 中 包含 一 个 或 多 个 列 的 范围 值 ) 
和 列表 分 区 (每 个 分 区 包含 一 列 的 值 列 表 )。 还 有 复合 分 区 ， 如 范围 - 哈 希 分 区 和 列表 - 哈 希 
分 区 (每 个 分 区 包含 值 的 范围 或 值 的 列表 ， 然 后 再 根据 哈 希 函数 进一步 分 解 每 个 分 区 )。 

也 有 这 种 情况 ， 我 们 经 常 需要 在 一 个 非常 大 的 表 中 检查 某 些 特定 的 列 ， 这 时 对 表 进 行 垂 
直 分 区 就 比较 合适 ， 将 经 常 访 问 的 列 放 置 到 一 个 表 中 ， 将 其 他 的 列 放置 在 其 他 表 中 (在 每 个 
分 区 中 都 要 复制 主键 以 便 重 构 原 表 )。 

分 区 表 有 许多 优点 : 

“改善 负载 平衡 : 分 解 后 的 表 可 以 放置 在 二 级 存储 的 不 同 的 地 方 ， 因 此 允许 并 发 访问 ， 而 

如果 表 不 被 分 解 ， 则 要 在 相同 的 时 间 争 用 相同 的 存储 区 域 。 

* 改善 性 能 : 通过 限制 将 被 检测 或 处 理 的 数据 的 数量 ， 并 且 通 过 建立 并 行 执行 机 制 ， 可 以 

改善 性 能 。 

“增强 可 用 性 : 如 果 分 区 被 存放 在 不 同 的 存储 区 域 中 , 并 且 当 一 个 存储 区 域 变 成 不 可 用 时 ， 

其 他 分 区 的 内 容 仍然 是 可 用 的 。 

“改善 可 恢复 性 : 分 区 越 小 ， 恢 复 起 来 就 更 快 (而 且 ，DBA 备 份 小 分 区 比 备份 很 大 的 表 要 

更 容易 )。 

“安全 性 : 一 个 分 区 中 的 数据 可 以 限制 只 有 某 些 用 户 可 以 访问 、 不 同 分 区 中 的 数据 可 以 有 

不 同 的 访问 限制 。 

分 解 表 也 有 一 些 缺 点 : 
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。 复 杂 性 : 分 区 表 通 常 对 最 终 用 户 是 不 透明 的 ， 而 且 使 用 多 个 分 区 表 数 据 的 查询 写 起 来 将 
比较 复杂 。 
。 降 低 性 能 : 当 查 询 用 到 多 个 分 区 中 的 数据 时 ， 执 行 速度 比 未 分 区 之 前 慢 。 
“重复 : 垂直 分 解 涉及 主键 的 复制 ， 这 导致 了 存储 需求 的 增加 ， 也 导致 了 汶 在 的 不 一 致 性 
的 增加 。 
8. 考虑 反 规范 化 的 影响 
应 该 考虑 反 规范 化 对 方法 学 前 边 的 步骤 的 影响 。 例 如 ， 可 能 需要 重新 考虑 已 进行 反 规范 
化 的 表 中 索引 的 选择 ， 以 检查 现存 的 索引 是 否 应 该 被 删除 ， 或 者 添加 额外 的 索引 。 另 外 ， 需 
要 考虑 如 何 维护 数据 完整 性 ， 通 常 的 解决 方法 是 : 
* 触发 器 : 触发 器 可 用 于 自动 更 新 派生 的 或 复制 的 数据 。 
“事务 : 在 每 个 应 用 中 构建 事务 使 对 反 规范 化 数据 的 更 新 作为 一 个 事务 的 操作 。 
* 批 调和 : 在 合适 的 时 间 运 行 批 程序 以 保持 反 规范 化 数据 的 一 致 。 
就 维护 完整 性 而 言 ， 触 发 器 是 最 好 的 解决 办 法 ， 尽 管 它们 可 能 会 产生 性 能 问题 。 表 15-1 
总 结 了 反 规 范 化 的 优点 和 缺点 。 
表 15-1 反 规 范 化 的 优点 和 缺点 


优 点 缺 ”点 


可 以 通过 下 述 方法 改善 性 能 : 引 能 会 加 快 检索 速度 ， 但 会 降低 更 新 速度 
“预计 算 派生 数据 
“ 最 小 化 需要 的 连接 
* 减少 表 中 外 键 的 数量 
* 减少 索引 的 数量 (因此 节省 了 存储 空间 ) 
“减少 了 表 的 数量 
总 是 与 应 用 有 关 并 且 如 果 应 用 被 改变 ， 则 需要 进行 重新 评估 
可 能 增加 表 的 大 小 
在 某 些 情况 下 可 能 简化 实现 ， 但 在 其 他 情况 下 可 能 会 更 复杂 


牺 和 性 了 灵活 性 . 
. 


9. 将 引入 的 宛 余 存档 
引入 的 元 余 以 及 引入 的 原因 应 该 全 部 存档 。 尤 其 是 ， 将 存在 许多 可 选 方案 时 选择 其 中 一 种 的 
原因 存档 。 更 新 逻辑 数据 模型 和 支持 文档 来 反映 反 规范 化 所 带 来 的 变化 作为 文档 的 结果 存档 . 


15.2 本 章 小 结 


“在 步骤 7 中 ， 考 虚 引 人 人 受 控 元 余 来 改善 性 能 。 

“ 有 时 可 能 发 生 这 样 的 情况 ， 接 收 失去 完全 规范 化 设计 所 带 来 的 好 处 而 改善 性 能 是 很 必要 
的 。 仅 当 估计 系统 不 能 满足 所 需要 的 性 能 时 ， 才 考虑 这 点 。 

“ 作为 一 个 规则 ， 如 果 性 能 不 能 达到 要 求 而 且 表 的 更 新 率 比较 低 而 查询 率 非常 高 ， 则 非 规 
范 化 可 能 是 个 可 行 的 选择 。 

“在 如 下 情况 下 考虑 反 规范 化 ， 特 别 对 于 加 速 常用 或 关键 事务 :合并 一 对 (1:1) 关 
系 ; 复制 一 对 多 (1:*) 关系 中 的 非 键 列 来 减少 连接 ; 复制 一 对 多 (1:*) 关系 中 的 外 刍 
列 来 减少 连接 ; 复制 多 对 多 (*:*) 关系 中 的 列 来 减少 连接 ; 引入 重复 组 ， 创 建 提取 
表 ; 划分 非常 大 的 表 。 
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复习 题 


15.1 描述 数据 库 设计 方法 学 中 步骤 7 的 目的 。 

15.2 解释 反 规 范 化 的 含义 。 

15.3 讨论 什么 情况 下 反 规 范 化 一 个 表 比 较 合适 ， 给 出 能 够 说 明 你 的 答案 的 例子 。 

15.4 描述 分 区 表 的 两 个 主要 方法 ， 并 讨论 每 种 方法 的 适用 情况 以 提高 性 能 。 给 出 能 够 说 
明 你 的 答案 的 例子 。 


练习 
15.5 对 附录 E 中 的 每 个 案例 研究 ， 讨 论 什么 时 候 进 行 反 规范 化 是 合适 的 。 








第 16 章 物理 数据 库 设 计 一 一 步骤 8 

本 童 主题 : 

。 监视 并 调整 操作 系统 的 重要 性 。 

。 如 何 确保 有 效 性 。 

。 系统 资源 怎样 影响 性 能 。 

本 章 讲述 了 我 们 的 物理 数据 库 设 计 方 法 学 的 最 后 一 步 。 在 前 面 的 四 章 中 ， 我 们 介绍 了 将 
逻辑 设计 转换 为 一 组 基本 表 、 选 择 合适 的 文件 组 织 方式 和 基于 对 绝 大 多 数 重要 事务 分 析 而 得 
来 的 索引 ， 考 虑 利用 受 控 元 余 来 获得 额外 的 系统 性 能 ， 并 且说 明了 如 何 实现 数据 库 安全 。 

随 着 用 户 需求 的 深化 ， 调 整 或 调节 数据 库 以 继续 获得 进一步 的 功能 通常 是 很 有 必要 的 。 
此 外 ， 你 可 能 发 现 需求 变化 了 ， 既 是 系统 成 功 、 用 户 要 求 更 多 功能 的 结果 ， 也 是 业务 深化 和 
调整 的 结果 。 在 本 章 中 ， 我 们 考虑 影响 这 些 方面 的 物理 数据 库 设计 的 其 余 步 又 。 


16.1 步骤 8: 监视 并 调整 操作 系统 
目标 监视 操作 系统 并 改善 系统 的 性 能 以 改正 不 正确 的 设计 决策 ， 或 者 反映 变化 的 需求 


物理 数据 库 设计 的 一 个 主要 目标 是 以 有 效 的 方式 存储 数据 ， 衡 量 有 效 性 时 有 很 多 因素 可 
以 使 用 : 
“ 事务 吞吐 量 : 这 是 在 一 个 给 定时 间 间 隔 内 处 理事 务 的 数量 。 在 有 些 系 统 中 ， 比 如 机 票 预 
订 系统 ， 高 的 事务 吞吐 量 是 整个 系统 成 功 的 关键 。 
* 响应 时 间 : 这 是 完成 单个 事务 所 花费 的 时 间 。 从 用 户 的 角度 看 ， 你 希望 尽 可 能 地 最 小 化 
响应 时 间 。 但 有 一 些 因素 影响 了 响应 时 间 ， 而 这 些 因素 可 能 是 你 无 法 控制 的 ， 比 如 系统 
加 载 时 间或 通信 时 间 。 可 以 通过 下 述 方法 缩短 响应 时 间 : 
* 降低 争 用 和 等 待 时 间 ， 特 别 是 磁盘 IO 等 待 时 间 。 
* 降低 所 需 时 间 资 源 的 数量 。 
。 使 用 较 快 的 组 件 。 
“磁盘 存储 : 这 是 存储 数据 库 文件 所 需 的 磁盘 空间 ， 你 可 能 希望 最 小 化 使 用 的 磁盘 存 
储 的 数量 。 | 
但 没有 一 个 因素 总 是 正确 的 。 通 常 ， 你 在 几 个 因素 之 间 进行 权衡 ， 来 获得 合理 的 平衡 。 
例如 ， 增 加 数据 存储 的 数量 可 能 会 降低 响应 时 间或 事务 的 吞吐 量 。 不 应 该 将 原始 的 物理 数据 
库 看 成 是 静止 不 变 的 ， 而 是 要 估计 操作 系统 会 怎样 实现 。 一 旦 实现 了 初始 设计 ， 就 应 该 监视 
并 调整 系统 ， 以 作为 观察 性 能 和 改变 需求 的 结果 。 许 多 DBMS 提 供 了 让 数据 库 管理 员 (DBA) 
监视 系统 的 操作 并 调整 系统 的 功能 。 
调整 数据 库 可 以 得 到 许多 好 处 : 
“可 以 避免 使 用 多 余 的 硬件 。 
“ 可 能 会 减少 对 硬件 配置 的 要 求 。 这 导致 更 小 和 更 便宜 的 硬件 和 潜在 地 更 昂贵 的 维护 。 
" 调整 较 好 的 系统 有 更 快 的 响应 速度 和 更 高 的 吞吐 量 ， 从 而 使 用 户 和 公司 更 有 效益 
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“改善 的 响应 速度 能 提高 员工 的 士气 。 

“改善 的 响应 速度 能 增强 顾客 的 满意 度 。 

后 两 条 好 处 比 其 他 的 更 抽象 。 但 是 ， 我 们 当然 可 以 肯定 地 说 ， 很 慢 的 响应 速度 会 使 员工 
失去 信心 并 且 会 法 在 地 失去 客户 。 

要 调整 数据 库 系统 ， 需 要 理解 不 同 的 系统 组 件 间 的 相互 作用 以 及 对 数据 库 性 能 的 影响 。 


16.1.1 理解 系统 资源 


为 了 改善 性 能 ， 你 必须 清楚 四 个 基本 的 硬件 组 件 是 如 何 相互 影响 并 影响 系统 性 能 的 : 

* 主 存 

。 CPU 

。 磁 盘 UVO 

“网 络 

每 个 资源 都 可 能 会 影响 系统 的 其 他 资源 ， 同 样 ， 改 进 一 个 资源 可 能 也 会 改进 其 他 的 系统 
资源 。 例 如 : 

* 添加 更 多 的 主 存 一 定 会 减少 页 面 调度 ， 这 有 助 于 避免 CPU 瓶颈 。 

* 更 有 效 地 使 用 主 存 可 能 会 减少 磁盘 IO。 

1. 主 存 

访问 主 存 要 比 访问 辅 存 快 得 多 ， 有 了 时 要 快 几 万 或 几 十 万 倍 。 通 常 ， 对 DBMS 和 数据 库 应 
用 来 说 ， 可 用 的 主 存 越 多 ， 应 用 程序 运行 得 越 快 。 但 是 ， 至 少 总 是 保留 5% 的 主 存 可 用 是 较 明 
智 的 。 同 样 地 ， 主 存 也 不 应 该 超过 10% 是 可 用 的 ， 否 则 主 存 并 不 是 被 最 佳 使 用 。 当 主 存 不 能 
容纳 所 有 的 进程 时 ， 操 作 系 统 把 进程 页 转移 到 磁盘 上 ， 来 释放 主 存 。 当 这 些 页 中 的 某 页 又 被 
需要 时 ， 操 作 系 统 必 须 把 它 从 磁盘 再 调 回 到 主 存 。 有 时， 需要 将 整个 程序 从 主 存 调 到 磁盘 ， 
然后 再 交换 回 主 存 ， 以 释放 主 存 。 当 换 页 (也 叫做 交换 ) 次 数 过 多 时 ， 就 会 发 生 问 题 。 

为 确保 有 效 地 利用 主 存 ， 你 需要 知道 目标 DBMS 是 如 何 使 用 主 存 的 ， 它 在 主 存 中 保存 的 
缓冲 区 是 什么 ， 允 许 你 调整 这 些 缓冲 区 的 参数 是 什么 等 等 。 例 如 ，Oracle 在 主 存 中 保留 一 个 数 
据 字典 高 速 缓存 ， 理 想 的 情况 是 这 个 高 速 缓存 应 该 足够 大 以 处 理 90% 的 数据 字典 访问 ， 而 不 
必 从 磁盘 检索 信息 。 你 也 需要 理解 用 户 的 访问 模式 : 访问 数据 库 的 并 发 用 户 的 增加 将 导致 使 
用 的 内 存 数 量 增加 。 

2. CPU 

CPU 控制 系统 其 他 资源 的 任务 并 执行 用 户 进 程 。 该 部 件 的 主要 目标 是 防止 CPU 争 用 ， 争 
用 时 进程 均 在 等 待 CU。 当 操 作 系统 或 应 用 程序 对 CPU 提出 过 多 的 要 求 时 ，CPU 就 会 产生 并 
颈 。 这 经 常 是 过 度 换 页 的 结果 。 

你 需要 知道 24 小 时 内 一 般 的 工作 量 ， 并 确保 不 仅 在 正常 的 工作 量 下 而 且 在 峰值 的 工作 量 
下 也 有 足够 的 资源 〈 例 如 ， 如 果 你 发 现在 正常 工作 量 期 间 有 90% 的 CPU 在 使 用 ， 并 有 10% 的 
CPU 空 间 ， 那 么 在 峰值 工作 量 期 间 CPU 可 能 就 不 够 了 )。 一 个 选择 是 确保 在 峰值 期 间 不 运行 不 
洗 要 的 工作 ， 让 这 些 工作 在 峰值 之 外 的 时 间 运 行 。 另 一 个 选择 可 以 是 考虑 多 CPU， 这 厚 许 分 
布 式 处 理 和 以 平行 的 方式 处 理 操作 。 

CUP MIPS (Millions of Instructions Per Second， 每 秒 指令 数 ) 可 用 于 作为 比较 平台 的 参 
数 ， 并 以 此 决定 它们 处 理 企业 吞吐 量 需求 能 力 。 
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3. 磁盘 LO 

对 任何 大 型 的 DBMS 来 说 ， 在 存储 和 检索 数据 时 都 有 相当 数量 的 磁盘 IO。 在 最 近 儿 年 ， 
CPU 时 钟 速 度 得 到 了 飞速 的 发 展 ， 而 MO 速度 并 没有 得 到 成 比例 的 增长 。 数 据 在 磁盘 上 的 组 织 
方式 对 整个 磁盘 的 性 能 有 很 大 的 影响 。 可 能 引起 的 一 个 问题 是 磁盘 和 争 用 ， 当 多 个 处 理 器 都 试 
图 同时 访问 同一 个 磁盘 时 就 会 发 生 这 种 情况 。 大 多 数 磁盘 对 访问 的 数量 和 每 秒 可 传输 的 数据 
量 都 有 限制 ， 当 达到 这 个 限制 时 ，CPU 就 不 得 不 等 待 磁盘 。 为 避免 这 种 情况 ， 建 议 存储 时 将 
数据 分 布 在 多 个 可 用 的 磁盘 上 ， 以 减少 发 生性 能 问题 的 可 能 性 。 图 16-1 说 明了 数据 在 磁盘 中 
分 布 数据 的 基本 原理 : 

* 操作 系统 文件 应 该 与 数据 库 文件 分 离 。 

* 主 数据 库 文件 应 该 与 索引 文件 分 离 。 

“恢复 日 志文 件 〈 如 果 可 能 并 且 可 用 )， 应 该 与 数据 库 其 他 的 部 分 分 离 。 


林口 口 癌 


操作 系统 主 数 据 库 文件 索引 文件 ”恢复 日 志文 件 





图 16-1 典型 的 磁盘 配置 


如 果 磁 盘 仍 然 出 现 过 载 ， 可 以 将 一 个 和 多 个 经 常 访 问 的 文件 移动 到 较 少 被 访问 的 磁盘 上 
(这 称 为 分 布 式 MO ) ， 通 过 对 每 个 磁盘 使 用 这 些 原 则 ， 让 每 个 磁盘 基本 具有 相同 数量 的 IO ， 
就 可 以 获得 负载 平衡 。 再 强调 一 次 ， 你 必须 理解 DBMS 是 如 何 操作 的 ， 了 解 硬件 的 特性 以 及 
用 户 的 访问 模式 。 

RAID 

磁盘 IO 已 经 因 RAID 技 术 的 出 现 而 得 到 了 很 大 的 改进 。RAID 最 初 表 示 Redundant Arrays 
of Inexpensive Disks (元 余 磁 盘 阵 列 )， 但 最 近 ，RAID 中 的 “I” 已 经 替换 为 Independent ( 独 
立 性 )。RAID 工 作 模式 是 有 一 个 大 的 磁盘 阵列 ， 它 由 儿 个 独立 的 且 有 组 织 的 磁盘 排列 而 成 ， 
用 于 增强 性 能 以 及 提高 可 靠 性 。 

性 能 是 通过 数据 条 (striping ) 增加 的 ， 数据 条 是 指 将 数据 划分 成 相同 大 小 的 分 区 (分 条 
单位 )， 这 些 分 区 透明 地 分 布 在 多 个 磁盘 上 。 这 会 让 用 户 觉得 是 一 个 大 的 、 非 常 快 的 磁盘 ,而 - 
实际 上 这 些 数据 是 被 分 布 在 几 个 较 小 的 磁盘 上 的 。 通 过 充 许 多 个 IO 并 行进 行 ， 分 条 技术 提高 
了 整个 MO 的 性 能 ， 同 时 数据 分 条 也 平衡 了 磁盘 间 的 负载 。 通过 使 用 奇偶 检验 机 制 或 错误 校 验 
机 制 在 多 个 磁盘 上 存储 元 余 信 息 也 提高 了 可 靠 性 。 在 磁盘 失败 时 ， 宛 余 信 息 可 用 于 重 构 失败 
磁盘 上 的 内 容 。 

有 有 几 种 形式 的 磁盘 的 配置 ， 即 RAID 级 别 ， 每 个 级 别提 供 的 性 能 和 可 靠 性 略 有 不 同 。 这 些 
RAID 级 别 是 : 

*RAID 0 一 一 无 元 余 : 这 个 级 别 维护 无 元 余数 据 ， 因此 有 最 好 的 写 性 能 ， 因 为 不 需要 复制 

更 新 。 数 据 条 在 块 一 级 完成 。 

“RAID ! 一 一 镜像 : 这 个 级 别 维护 镜像) 不 同 磁盘 上 的 数据 的 两 个 相同 的 拷贝 。 在 磁盘 

失败 时 要 维护 一 致 性 ， 写 可 能 不 是 同步 完成 的 。 这 是 最 昂贵 的 存储 方式 。 
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*" RAID 0+1 一 一 非 元 余 和 镜像 的 :这 个 级 别 将 分 条 和 镜像 结合 起 来 。 

"RAID ?一 一 错误 校正 代码 : 在 这 个 级 别 ， 分 条 单位 是 一 个 位 ， 并 且 错 误 校正 代码 被 作为 

元 余 机 制 使 用 。 

“RAID 3 一 位 交叉 奇偶 校 验 : 这 个 级 别 通过 在 阵列 中 的 一 个 磁盘 上 存储 奇偶 信息 来 提供 

元 余 。 奇 偶 信 息 可 用 于 恢复 在 其 他 磁盘 上 的 数据 。 这 个 级 别 比 RAID 1 使 用 的 存储 空间 

少 ,但 奇偶 磁盘 可 能 会 成 为 瓶颈 。 

“RAID 4 一 块 交叉 奇偶 校 验 ， 在 这 个 级 别 ， 分 条 单位 是 一 个 磁盘 块 一 在 -个 单独 的 磁 

盘 上 维护 一 个 奇偶 块 ， 用 于 与 其 他 磁盘 上 的 块 相对 应 。 如 果 某 个 磁盘 失败 了 ， 则 此 奇偶 

块 可 与 其 他 磁盘 上 对 应 的 块 一 起 恢复 失败 磁盘 上 的 块 。 

“AIP 5 一 块 交叉 分 布 的 奇偶 校 验 ， 这 个 级 别 使 用 奇偶 数据 来 提供 元 余 ， 这 同 RAID 3 

的 方式 一 样 ， 但 是 在 所 有 的 磁盘 上 将 奇偶 数据 分 条 ， 这 同 分 条 源 数据 的 方式 很 类 亿 ， 这 

减轻 了 在 奇偶 磁盘 上 的 瓶颈 。 四 

* RAID 6 P+ 元 余 : 这 个 级 别 类 似 于 RAID 5， 但 维护 附加 的 元 余数 据 以 防止 多 个 磁 

盘 失 败 。 它 使 用 错误 校 验 代码 而 不 是 奇偶 校 验 ，。 

对 了 大 多 数 数据 库 应 用 程序 ， 通 常 选择 RAID 1、RAID 0+1 和 RAID 5。 例 如 、Oracle 推 基 
对 于 重 做 日 志文 件 使 用 RAID 1， 对 于 数据 库 文件 ， Oracle 推 荐 使 用 RAID 5， 只 要 写 负载 是 可 
接受 的 ， 否 则 ，Oracle 推 荐 RAID 1 和 RAID 0+1。 再 强调 一 次 ， 你 应 该 了 解 哪个 RAID 选 项 挝 
今 、 你 的 硬件 配置 ， 并 且 要 知道 不 同 的 DBMS 组 件 如 何 使 用 磁盘 MO。 以 便 你 可 以 选择 合适 的 
方案 。 

4. 网 络 

当 大 量 数据 在 网 络 间 传 送 时 ， 就 会 发 生 网 络 瓶颈 问题 . 


16.1.2 小 结 





引 反 是 永远 才 不 会 终结 的 活动 。 在 系统 的 整个 生命 膨 期 中 、 需 要 监视 系统 性 能 ， 庆 其 中 
另 二 下 缠 和 用 户 需求 的 变化 。 但 是 ， 在 操作 系统 其 -方面 上 进行 所 高 性 能 的 改变 ， 洒 花 公 和 
和 训 ， 思 起 反作用 。 例 如 ， 为 表 增 加 索引 ， 会 改善 -种 应 用 的 性 能 ， 但 可 能 会 影响 另 个 
定 训 站 要 的 应 用 。 因 此 ， 当 对 操作 系统 进行 修改 时 ， 一 定 要 小 心 。 如 果 可 能 ， 在 实验 下 所 总 
“下 这 此 更改 ， 或 者 在 系统 没有 被 完全 使 用 时 (例如 ， 工 作 时 间 以 外 )， 对 未 统 进行 出 

提示 加 束 们 在 方法 学 的 步 环 4 中 所 讨论 的 ， 大 多 数 的 性 能 增益 来 自 好 的 数据 库 设计 

忆 吉 让 孝 分析 和 使 用 合适 的 尝 下 。 尽管 下 过 某 些 步骤 或 仓促 完成 某 些 步 驴 会 节省 时 间 ， 

全 个 到 居 提 偶 不 要 这 样 做 ， 我 们 相信 在 数据 库 设计 中 花 划 足够 的 时 间 在 以 后 的 过 尼 

中 将 受益 无 穷 。 

将 调整 活动 记 入 文档 

， 当 系统 所 售 用 的 机 人 应 该 被 完全 地 记录 到 文档 中 ， 包 括 使 用 这 种 调整 方 案 的 奢 因 ， 
别 的 ， 当 有 多 个 可 选 方案 时 ， 要 记录 下 选择 其 中 某 个 方案 的 原 内 
16.1.3 StayHome 的 新 需求 


时 系统 以 维护 最 佳 性 能 的 同时 ， 也 要 大 虑 变化 的 需求 。 我 们 已 经 确定 了 Video 表 应 
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存储 录像 的 封面 和 简要 的 故事 情节 ， 以 准备 在 网 上 制定 录像 目录 。 可 以 使 用 Microsoft Access 中 
的 OLE (对 象 链接 与 似 入 ) 数据 类 型 ， 该 数据 类 型 用 来 存储 Microsoft Word 或 Excel 的 文档 、 图 
片 、 声 音 以 及 在 其 他 程序 中 创建 的 其 他 类 型 的 二 进 制 数据 。OLE 对 象 可 以 链接 或 藤 入 到 
Microsoft Access 表 的 字段 中 ， 并 且 能 够 在 窗 体 或 报表 中 显示 出 来 。 

为 了 满足 这 种 新 需求 ， 可 以 重 构 Video 表 ， 增 加 如 下 的 列 : 

。videoCover 列 ， 声 明 为 OLE Object 数据 类 型 。 这 个 列 字段 保存 录像 封面 的 图 像 ， 这 个 图 

像 是 通过 扫描 封面 并 将 这 个 图 像 保存 为 BMP 图 形 文件 创建 的 。 

。storyLine 列 ， 声 明 为 Memo 数 据 类 型 ， 可 存储 较 长 的 文本 。 

使 用 这 些 新 列 的 表格 如 图 16-2 所 示 。 这 两 个 额外 加 入 的 列 的 主要 问题 是 潜在 地 扩大 了 使 
用 的 磁盘 空间 ， 这 些 空间 能 存储 大 量 的 图 形 文件 ， 并 为 故事 情节 存储 大 量 的 文本 。 因 此 ， 需 
要 继续 监视 StayHome 数 据 库 的 性 能 ， 以 确保 满足 新 需求 的 同时 没有 危害 系统 的 性 能 。 





图 16-2 基于 修改 后 增加 了 videoCover 和 storyLine 两 列 的 Video 表 的 窗 体 









有 既然 已 经 学 习 了 方法 学 中 的 所 有 步骤 。 你 可 能 想 回顾 9.1.3 节 ， 重 新 认识 我 们 所 说 
的 成 功 的 数据 库 设计 的 关键 。 当 你 首次 读 这 一 节 时 ， 可 能 很 难看 出 某 些 因素 的 正确 ， 
但 希望 你 现在 会 发 现 所 有 因素 的 重要 性 。 


16.2 本 章 小 结 


“步骤 8 是 物理 数据 库 设 计 的 最 后 一 步 ， 包 括 监视 并 调整 操作 系统 ， 以 获得 最 大 性 能 或 者 
反映 变化 的 需求 。 

* 物理 数据 库 设 计 的 一 个 主要 目标 就 是 以 有 效 的 方式 存储 数据 。 有 许多 因素 可 用 于 衡量 有 
效 性 ， 包 括 吞 吐 量 、 响 应 时 间 和 磁盘 存储 。 

"为 改善 性 能 ,你 必须 知道 下 述 四 个 硬件 组 件 是 如 何 相互 作用 的 以 及 如 何 影响 系统 性 能 的 ， 
这 个 四 个 硬件 是 : 主 存 、CPU、 磁 盘 IO 和 网 络 。 

“磁盘 LO 由 于 引入 RAID (Redundant Array of Independent Disks ) 技术 而 发 生 了 革命 性 的 
变化 。RAID 工作 模式 是 有 一 个 大 的 磁盘 阵列 ， 它 由 儿 个 独立 的 且 有 组 织 的 磁盘 排列 而 
成 ， 用 于 增强 性 能 以 及 提高 可 靠 性 。 









复习 题 


16.1 
16.2 
16.3 
16.4 
16.5 


争 16 章 ”物理 强 据 摩 朗 于 一 一 步 隔 8 


描述 本 章 给 出 的 物理 数据 库 设计 方法 学 步 又 的 主要 目的 。 

可 以 使 用 哪些 因素 衡量 有 效 性 ? 

讨论 四 个 基本 的 硬件 组 件 是 如 何 相互 作 用 并 影响 系统 性 能 的 。 
应 该 如 何在 磁盘 中 分 布 数据 ? 

什么 是 RAID 技 术 ? 这 个 技术 是 如 何 提高 性 能 和 可 靠 性 的 ? 
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第 18 章 。 Perfect Pets 一 一 使 用 物理 数据 库 设 计 方法 学 


第 17 章 Perfect Pets 一 一 逻辑 数据 库 设 计 


在 本 章 中 ,我 们 又 提供 了 一 个 例子 ， 以 帮助 加 强 理 解 第 9 章 ~ 第 16 章 中 所 提出 的 方法 学 。 
我 们 在 这 一 章 使 用 逻辑 数据 库 设计 方法 学 的 步 又， 然后 在 下 一 章 使 用 物理 数据 库 设 计 方 法 学 
的 步骤 。 为 了 说 明 物理 实现 的 不 同方 面 ， 我 们 也 使 用 了 一 个 不 同 的 关系 数据 库 管理 系统 ， 即 
Oracle 9i。 我 们 建议 首先 阅读 下 面 所 介绍 的 例子 ,然后 读者 最 好 自己 按照 方法 学 的 步 又 进行 
设计 ， 你 可 以 将 自己 的 方法 和 书 中 的 示例 进行 比较 。 附 录 A 对 方法 学 进行 了 总 结 。 


17.1 _ Perfect Pets 


叫做 Perfect Pets 的 组 织 为 全 美的 宠物 提供 了 个 体 健康 管理 。 位 于 美国 主要 城市 的 不 同 诊 
所 共同 提供 了 该 服务 。Perfect Pets 的 执行 官 注意 到 在 该 业务 领域 缺乏 交流 ， 尤 其 是 在 不 同 的 
诊所 之 间 共享 信息 和 资源 很 少 。 为 了 解决 这 个 问题 ， 执 行 官 要 求 建立 一 个 中 央 数 据 库 ， 来 帮 
助 该 业务 更 有 效 地 运行 。 执 行 官 为 当前 系统 提供 了 如 下 的 描述 。 


17.1.1 数据 需求 


， 工 宛 物 诊所 

Perfect Pets 在 全 美的 大 城市 有 许多 宠物 诊所 。 每 个 诊所 的 详细 信息 包括 诊所 号 、 诊 所 地 
址 (由 街区 、 城 市 、 州 和 上 邮政 编码 组 成 )、 电 话 和 传真 号 码 。 每 个 诊所 有 一 个 经 理 和 一 些 员工 
(例如 ,兽医 、 护 士 、 秘 书 、 清 洁 人 员 等 )。 在 整个 组 织 中 ， 诊 所 号 是 唯 _ 的 ， 
SH 2. 页 :| i | 
“”“ 员工 中 每 个 成 员 的 详细 信息 包括 员工 号 、 姓 名 ( 姓 和 名 )、 地 址 (街区 、 城市 、 州 和 上 邮编 )、 
电话 号 码 、 出 生日 期 、 性 别 、 社 会 保障 号 码 (SSN)、 职 位 和 当前 的 全 年 工资 .在 整个 业务 中 
员工 号 是 唯一 的 。 

3. 宠物 主人 

当 宠物 主人 第 一 次 到 Perfect Pets 诊 所 时 ， 完 物 主人 的 详细 信息 就 被 记录 下 来 。 其 中 包括 
主人 人 号码、 主人 姓名 ( 妊 和 名 )、 地 址 (街区 、 城 市 、 州 和 邮编 ). 家 庭 电话 号 码 。 对 每 个 诊 
所 来 说 ， 主 人 的 号 码 是 唯一 的 。 | 

4. 宠物 ” 

需要 诊治 的 宠物 的 详细 信息 包括 宠物 号 码 、 宠 物 名 、 宠 物 类 型 ， 宠 物 描述 、 册 生日 期 
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( 如 果 不 知道 ， 记 录 一 个 大 致 的 日 期 )、 到 诊所 的 登记 日 期 、 当 前 状态 ( 生 / 死 ) 以 及 宠物 主人 
的 详细 信息 。 对 每 个 诊所 来 说 ， 宠 物 号 码 是 唯一 的 。 

5. 检查 

当 一 只 生病 的 宠物 到 达 诊 所 后 ， 值 班 兽医 开始 为 它 进 行 检查 。 记 录 每 次 检查 的 详细 信息 ， 
其 中 包括 检查 号 码 、 检 查 的 日 期 和 时 间 、 兽 医 的 姓名 、 宠 物 号 码 、 宠 物 名 字 、 宠 物 类 型 ， 以 
及 检查 结果 的 详细 描述 。 对 每 个 诊所 来 说 ， 检 查 号 码 是 唯一 的 。 作 为 检查 的 结果 ， 兽 医 应 该 
为 宠物 提出 诊治 方案 。 

6. 诊治 方案 

Perfect Pets 为 所 有 类 型 的 宠物 提供 不 同 的 诊疗 方式 。 这 些 诊治 方式 在 所 有 诊所 内 遵循 相 
同 的 标准 。 每 次 诊治 的 详细 信息 ， 包 括 诊治 方案 号 、 诊 治 方案 的 具体 内 容 、 宠 物 主 人 的 花费 。 
例如 ， 诊 治 方案 包括 : . 


T123 盘 尼 西林 抗生素 系列 $50.00 
T155 猫 科 绝 育 手术 $200.00 
T112 预防 猫 科 流 行 性 感冒 的 接种 $70.00 
T56 小 型 厂 科 一 一 每 天 的 照顾 (包括 饲养 ) $20.00 


每 次 检查 都 要 付 20.00 美 元 ， 检 查 时 记录 该 检查 的 诊治 种 类 。 诊 治 号 码 唯一 地 标识 每 种 诊 
褒 种 类 ， 并 且 在 所 有 的 Perfect Pets 诊 所 是 通用 的 。 

7. 宠物 诊治 

基于 对 生病 的 宠物 的 检查 结果 ， 兽 医 提出 一 种 或 几 种 类 型 的 诊治 方案 。 这 个 诊治 方案 要 
记录 的 信息 包括 检查 号 码 和 日 期 、 宠 物 号 码 、 名 字 和 种 类 、 诊 治 方案 号 、 处 方 描述 、 每 种 类 
型 的 诊治 数量 以 及 诊治 的 开始 和 结束 日 期 。 每 种 类 型 的 诊治 方案 的 额外 事项 也 要 记录 。 

8. 国 栏 

有 时， 必须 把 生病 的 宠物 留 在 诊所 。 每 个 诊所 有 20~30 个 动物 围栏 ， 每 个 围栏 可 容纳 1~4 个 
宠物 。 每 个 围栏 有 唯一 的 围栏 号 、 容 量 和 状态 (表明 是 否 可 用 )。 生 病 的 宠物 被 安置 在 围栏 中 ， 
同时 记录 下 宠物 的 详细 信息 、 该 宠物 需要 的 诊治 方案 以 及 所 有 额外 的 照管 该 宠物 的 信息 。 同 时 
也 要 记录 宠物 待 在 围栏 中 的 详细 信息 ， 包 括 围 栏 号 、 完 物 进入 和 离开 围栏 的 日 期 。 根 据 这 物 的 
生病 情况 ， 在 一 个 围栏 中 可 能 会 同时 容纳 多 只 宠物 。 对 每 个 诊所 来 说 ， 围 栏 号 是 唯一 的 ， 

9. 账单 

宠物 的 主人 要 负责 宠物 诊治 的 费用 。 检 查 诊治 宠物 后 ， 要 给 该 宠物 的 主人 开 账 单 。 记 录 
账单 的 详细 情况 包括 账单 号 码 、 账 单 日 期 、 宠 物 主人 号 码 、 宠 物 主人 姓名 和 完整 地 址 、 宠 物 
号 码 、 宠 物 名 字 和 诊治 方案 的 详细 信息 。 账 单 提供 了 每 种 诊治 所 需 的 费用 和 对 一 个 宠物 所 进 
行 的 所 有 诊治 的 总 的 费用 。 | 

在 支付 账单 的 时 候 ， 还 要 记录 一 些 数 据 ， 包 括 支付 账单 的 日 期 和 支付 的 方法 (例如 ， 支 
票 、 现 金 、 信 用 卡 )。 在 整个 组 织 中 ， 账 单 号 码 是 唯一 的 。 

10. 外 用 品 、 非 外 用 品 及 药品 的 供应 

每 个 诊所 都 有 一 些 外 用 品 〈 例 如 ,注射器 、 无 菌 胶带 、 绷 带 ) 和 非 外 用 品 ( 例 如， 塑料 
袋 、 围 禧 、 小 盘子 、 宠 物 名 称 的 标签 、 宠 物 食品 ) 的 储备 。 外 用 和 非 外 用 品 供应 的 详细 信息 
包括 项 目 号 和 名 称 、 项 目 描述 、 储 存 数量 (在 每 个 月 的 最 后 一 天 确定 )、 追 加 订货 程度 、 沁 加 
订货 数量 和 费用 。 在 诊所 中 ， 项 目 号 对 每 种 外 用 和 非 外 用 品 是 唯一 的 。 
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每 个 诊所 也 存储 一 些 药品 (例如 ， 抗 生 素 、 镇 痛 剂 )。 药 品 供应 的 详细 信息 包括 药品 号 和 
名 称 、 药 品 介绍 、 计 量 、 配 方 、 储 存 数量 ( 每 个 月 的 最 后 一 天 确定 )、 记 录 级 别 、 记 录 订 货 
数量 和 费用 。 药 品 号 唯一 地 标识 每 种 供应 药品 ， 并 在 整个 组 织 内 通用 。 

11. 预约 

如 果 宠 物 要 稍 后 再 看 医生 ， 主 人 和 宠物 就 要 进行 预约 。 记 录 预 约 的 详细 信息 ， 包 括 预 约 
号 码 、 主 人 号 码 、 主 人 姓名 ( 姓 和 名 )、 家 庭 电话 号 码 、 宠 物 号 码 、 宠 物 名 称 、 宠 物种 类 和 项 
约 日 期 和 时 间 。 对 每 个 诊所 来 说 ， 预 约 号 码 是 唯一 的 。 


17.1.2 事务 需求 


下 面 列 出 的 是 Perfect Pets 数 据 库 应 用 应 该 支持 的 事务 。 

1. 数据 应 该 能 够 支持 下 述 维护 事务 

(a) 创建 和 维护 记录 Perfect Pets 的 各 诊所 的 详细 信息 和 每 个 诊所 的 员工 的 记录 。 

(b) 创建 和 维护 记录 宠物 主人 的 详细 信息 的 记录 。 

(c) 创建 和 维护 宠物 的 详细 信息 。 

(d) 创建 和 维护 记录 可 实现 的 诊治 宠物 方案 的 详细 信息 的 记录 。 

(e) 创建 和 维护 记录 对 宠物 所 进行 的 检查 和 诊治 的 详细 信息 的 记录 。 

(f 创建 和 维护 记录 给 宠物 主人 的 治疗 其 完 物 的 花费 的 账单 的 详细 信息 的 记录 。 

(g) 创建 和 维护 记录 每 个 诊所 中 的 外 科 用 品 、 非 外 科 用 品 和 药品 的 供应 的 记录 。 

(h) 创建 和 维护 记录 每 个 诊所 中 可 用 的 围栏 ， 以 及 每 个 围栏 宠物 的 分 配 的 记录 。 

Q 创建 和 维护 每 个 诊所 中 ， 完 物 主人 / 充 物 的 预约 。 

2. 数据 应 该 能 够 支持 下 述 查 询 事 务 

(a) 以 报表 形式 列 出 经 理 的 名 字 、 诊 所 地 址 、 每 个 诊所 的 电话 号 码 ， 按 诊所 号 码 排 序 。 
(b) 以 报表 形式 列 出 宠物 主人 的 姓名 、 号 码 ， 以 及 他 们 宠物 的 详细 信息 。 

(c) 列 出 对 某 一 给 定 的 宠物 进行 检查 的 历史 信息 。 

(d) 列 出 基于 给 定 的 检查 结果 提供 的 诊治 方案 的 详细 信息 。 

(e) 为 某 一 给 定 的 宠物 主人 列 出 没有 支付 的 账单 的 详细 信息 。 

( 以 报表 形式 列 出 到 某 一 给 定 日 期 还 没有 支付 的 账单 ， 按 账单 号 排序 。 

(g) 列 出 某 一 给 定 日 期 纽约 地 区 诊所 可 使 用 的 围栏 的 详细 信息 ， 按 诊所 号 排序 。 

(h) 以 报表 形式 提供 每 个 诊所 全 体 员工 月 工资 的 总 和 ， 按 诊所 号 排序 。 

人 列 出 诊治 费用 的 最 大 值 、 最 小 值 和 平均 值 。 

0) 列 出 每 种 类 型 的 宠物 的 总 数 , 按 宠物 类 型 排序 。 

(k) 以 报表 形式 列 出 所 有 超过 50 岁 的 兽医 和 护士 的 姓名 和 员工 号 ， 按 员工 姓名 排序 。 
(QD) 列 出 某 一 诊所 ， 在 某 一 给 定 日 期 的 预约 情况 。 

(m) 列 出 每 个 诊所 的 宠物 的 总 数 ， 按 诊所 号 排序 。 

(n) 以 报表 形式 列 出 1997 年 ~ 1999 年 之 间 的 宠物 主人 的 账单 的 详细 信息 ， 按 账单 号 排序 。 
(o) 列 出 特定 宠物 主人 的 宠物 的 号 码 、 名 字 和 详细 描述 。 

(Pp) 以 报表 形式 列 出 每 个 诊所 应 再 订购 的 药物 ， 按 诊所 号 排序 。 

(9) 列 出 每 个 诊所 当前 所 储存 的 非 外 科 用 品 和 外 科 用 品 的 总 价值 ， 按 诊所 号 排序 。 
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17.2 使 用 逻辑 数据 库 设计 方法 


在 这 一 节 中 ， 我 们 继续 使 用 逻辑 数据 库 设 计 方 法 学 中 的 各 个 步骤 ， 提 出 一 个 可 满足 以 上 
需求 的 逻辑 数据 模型 。 我 们 假定 需求 收集 和 分 析 阶 段 只 定义 了 一 个 用 户 视图 。 


17.2.1 .步骤 1.1: 标识 实体 


逐 辑 数据 库 设计 的 第 一 个 步骤 是 标识 在 数据 库 中 必须 描述 的 主 实体 。 由 上 面 的 描述 ， 可 
以 标识 如 下 实体 : 


Clinic (诊所 ) Staff (员工 ) 

PetOwner (宠物 主人 ) Pet (宠物 ) 

Examination (检查 ) Treatment (诊治 方案 ) 
Pen (围栏 ) PetTreatment ( 宠物 诊治 ) 
Invoice (账单 ) Appointment (预约 ) 


Stock( 特 化 Surgical (外 用 )、 NonSurgical ( 非 外 用 ) 和 Pharmaceuticals (药品 ) ) 

将 实体 存档 

为 实体 命名 时 ， 应 该 有 意义 的 并 且 对 用 户 直 观 的 名 字 ， 在 数据 字典 中 记录 他 们 的 详细 信 
息 。 图 17-1 为 数据 字典 中 记录 Perfect Pets 实 体 的 部 分 。 


One or more Perfect | 
Pet clinics located in 
main cities 


“| Each member of 


Staff works at a 
| particular clinic. 





图 17-1 数据 字典 中 记录 Perfect Pets 实 体 的 部 分 
To 步骤 1.2: 标识 关系 


标识 完 实体 后 ， 下 一 步 就 是 标识 存在 于 这 些 实体 之 间 的 所 有 关系 ( 见 5.2 节 )。 对 于 Perfect 
Pets 而 言 ， 应 该 标识 出 如 图 17-2 所 示 的 关系 。 

Db: 确定 关系 的 多 样 性 约束 

标识 完 要 创建 的 关系 后 ， 现在 应 该 确定 每 个 关系 的 多 样 性 ( 见 5.5 节 ) 约束 。 对 于 Perfect 
Pets 而 言 ， 应 该 标识 出 如 图 17-3 所 示 的 多 样 性 约束 。 
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2. 使 用 实体 一 关系 (ER) 建 模 
在 数据 库 设 计 阶段 ， 将 创建 几 个 代表 Perfect Pets 的 ER 模型 。 图 17-4 显 示 了 Perfect Pets 的 


ER 模型 初稿 。 


a 


Examination 
Treatment 
Invoice 


“# 


Hoilds 
Registers 
Provides 
Schedules 
lsContactedBy 


Performs 


Appointment 
PetOwner 
Clinic 
Examination 
Pet 

Invoice 
Appointment 
Examination 
Pen 
Appointment 
PetTreatment 
PetTreatment 
Examination 





Perfect Pets 中 关系 的 初稿 


Has 

Holds 
Registers 
Provides 
Schedules 
IsContactedBy 
Manages 
Performs 
Owns 

Pays 

Attends 
Undergoes 
IsAllocatedTo 
Attends 
ResultsIn 


. UsedIn 


ResultsFrom 


Dd fam 
i 


i ed 


图 17-3 上 面 所 定义 的 关系 的 多 样 性 约束 


Staff 

Stock 

Pet 

Pen 
Appointment 
PetOwner 
Clinic 
Examination 
Pet 

Invoice 
Appointment 
Examination 
Pen 
Appointment 
PetTreatment 
PetTreatment 
Examination 
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17.2.3 步骤 1.3: 标识 实体 或 关系 的 有 关 属 性 


下 一 个 步骤 是 标识 与 已 经 标识 的 实体 或 关系 有 关 的 属性 。 对 于 Perfect Pets 而 言 ， 应 该 标 
识 如 图 17-5a 所 示 的 与 实体 相关 的 属性 。 


Clinic | clinicNO、 address (street、 city、 state、 zipCode)、telNo、faxNo 

Staff staffNo、sName (SFName、sSLName)、SAddress (sStreet、sCity、sState、 
sZipCode)、 sTelNo. DOB,、 sex. SSN、 position、 salary 

PetOwner OwnerNo、 oName (oFName、 oLName). oAddress (oStreet、 oCity、 
oState、oZipCode)、oTelNo 

Pet petNo、 petName、 petType、 petDescription、 pDOB、 dateRegistered. 


petStatus 
Examination examNo、 examDate、examTime、examResults 
Treatment treatNo、description、cost 
Pen penNo. penCapacity、 penStatus 
Invoice invoiceNo、invoiceDate、datePaid、paymentMethod 
Stock: Item itemNo 、itemName、itemDescription 、itemCost 
Stock: Pharmacy drugNo、drugName、drugDescription、dosage、methodAdmin、 drugCost 
Appointment appNo、aDate、aTime 
PetTreatment startDate、endDate、quantity 、ptComments 





a) 与 实体 有 关 的 属性 


IsAllocatedTo dateIn、dateOut、comments 









Holds inStock、 reorderLevel、 reorderQty 





b) 与 关系 有 关 的 属性 
图 17-5 Perfect Pets 中 的 属性 


但 是 。 当 检查 关于 围栏 的 信息 时 ， 描述 宠物 进 / 出 围栏 日 期 的 dateIn/dateOut 属 性 以 及 
comment (注释 ) 属性 ， 很 难 只 与 Pen 实 体 或 Pet 实 体 相关 。 同 样 ， 描 述 不 同 物品 存储 数量 的 
inStock 属 性 以 及 reorderLevelreorderQty( 追 加 订货 级 别 /追加 订货 数量 ) 属 性 ， 很 难 只 与 Clinic 
或 Stock 实 体 相关 。 在 这 两 个 例子 中 ， 应 该 确保 没有 漏 掉 任何 实体 或 者 将 这 些 属性 与 相应 的 关 
系 相 联 ， 如 图 17-5b 所 示 。 

应 该 注意 ， 在 两 个 实体 中 不 应 有 相同 的 属性 ， 属性 的 出 现实 际 上 是 代表 了 实体 之 间 的 关 
系 。 例 如 ， 在 17.1.1 节 中 所 给 出 的 需求 说 明 中 ， 在 “检查 ”项 目 中 说 明 每 次 检查 的 详细 信息 包 
括 “ 兽 医 姓 名 ”。 在 这 里 你 可 能 会 被 误导 ， 认为 同时 在 Staff 和 Examination 实 体 中 包含 兽医 姓 
名 。 但 是 ， 这 是 不 正确 的 : 在 这 种 情况 下 ， 兽医 姓名 的 出 现代 表 了 一 个 关系 ,不 应 该 把 它 作 
为 Examination 实 体 的 一 个 属性 。 如 果 你 确实 把 它 作 为 Examination 的 一 个 属性 ， 将 会 导致 
Examination 表 不 符合 第 三 范式 要 求 。 


提示 。 没有 经 验 的 设计 者 经 常 犯 这 样 的 错误 ， 一 定 要 注意 。 
将 属性 存档 
为 属性 命名 时 ， 应 该 为 它们 取 有 意义 而 且 对 用 户 直观 的 名 字 ， 在 数据 字典 中 记录 它们 的 
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详细 信息 ， 正 如 第 9 章 步 又 1.3 中 所 讨论 的 那样 。 
17.2.4 步骤 1.4: 确定 属性 域 

现在 要 为 上 一 步 在 数据 字典 中 所 标识 的 属性 添加 必要 的 属性 域 。 
17.2.5 步骤 1.5: 确定 候选 键 、 主 键 和 备用 键 属性 


这 个 步骤 主要 是 为 实体 标识 候选 键 ， 然 后 选择 其 中 之 一 作为 主键 。 在 标识 主键 的 过 程 中 ， 
要 特别 注意 实体 是 强 实体 还 是 弱 实 体 。 

在 标识 候选 键 时 ， 应 该 注意 到 Clinic 实 体 的 诊所 号 、Staff 实 体 的 员工 号 、Treatment 实 体 的 
诊治 方案 号 码 、lnvoice 实 体 的 账单 号 、Stock 实 体 的 项 目 /药品 号 ， 这 些 号 码 在 整个 组 织 中 都 是 
唯一 的 。 另 一 方面 ，PetOwner 实 体 的 宠物 主人 号 码 、Pet 实 体 的 宠物 号 码 、Pen 实 体 的 围栏 号 
码 ， 只 是 在 某 一 个 具体 的 诊所 内 是 唯一 的 。 一 个 组 织 给 不 同 的 办 事 处 一 定 程度 的 地 方 自治 权 
是 很 普遍 的 。 但 是 ， 在 中 央 数 据 库 系 统 中 ， 在 全 局 范围 内 是 唯一 的 就 比较 合适 。 在 讨论 
Perfect Pets 的 管理 需求 时 ， 每 个 诊所 中 的 号 码 ， 都 应 该 在 全 局 范围 内 分 配 ， 而 不 是 在 每 个 具 
体 的 诊所 中 分 配 。 如 果 不 这 样 的 话 ， 也 应 该 在 那些 号 码 中 添加 诊所 号 码 ， 同时 保证 那些 号 码 
在 每 个 诊所 中 是 唯一 的 ， 如 此 一 来 ， 就 具有 全 局 范围 内 的 唯一 性 了 。 

请 记 住 ， 现 在 应 该 标识 主键 ， 如 图 17-6 所 示 (其 他 备用 键 如 图 17-9 所 示 )。 尤其 要 注意 的 
是 ， 应 该 标识 PetTreatment 为 弱 实 体 。 


17.2.6 步骤 1.6: 特 化 和 泛 化 实体 


当前 的 Stock 实 体 的 定义 已 经 为 继续 进行 逻辑 数据 库 设计 方法 学 的 其 他 步骤 作 好 了 准备 。 
但 是 ， 为 了 更 准确 地 建 模 ， 你 可 能 想 要 增加 额外 的 信息 。 需求 说 明 表 明 外 用 品 和 非 外 用 品 的 
供应 有 唯一 的 项 目 号 来 区 分 它们 ， 也 有 了 唯一 的 药品 号 来 区 分 药品 的 供应 。 此 外 ， 这 两 种 类 型 
供应 的 属性 方面 稍微 有 些 不 同 。 因 此 ， 我 们 可 以 考虑 把 Surgical/NonSurgical Stock 和 
Pharmaceuticals 作 为 Stock 实 体 的 特殊 类 型 。 此 特 化 / 泛 化 如 图 17-6 所 示 (可 选 步 又 )。 为 了 简 
便 ， 我 们 把 Surgical/Non-Surgical Stock 和 Pharmaceuticals 分 别 重新 命名 为 Item 和 Pharmacy ( 特 
化 和 泛 化 的 定义 见 第 11 童 )。 

你 也 可 以 标识 Vet( 兽 医 )、Nurse( 护 士 )、 Secretary( 秘 书 ) 和 Cleaner( 清 洁 人 员 ) 为 Staff 的 特殊 
类 型 。 尽 管 这 些 职位 都 有 相同 的 属性 ， 但 只 有 Vet 实 体 参 与 了 Performs (执行 ) 与 Examination 
的 关系 。 这 将 是 模型 化 Staff 的 一 个 非常 有 效 的 方法 ， 但 为 了 尽量 保持 模型 简单 ， 我 们 将 省 略 
掉 这 个 特 化 / 泛 化 步骤 。 ， 


17.2.7 步骤 1.7: 检查 模型 的 数据 宛 余 


现在 ， 得 到 了 一 个 Perfect Pets 的 逻辑 数据 模型 。 但 是 ， 这 个 数据 模型 包含 一 些 应 该 被 市 
除 的 元 余 。 特 别 要 注意 的 是 ， 必 须要 ; 

* 重新 检查 一 对 一 (1:1) 关系 。 

* 删除 元 余 关 系 。 

1. 一 对 一 (1:1) 关系 

在 图 17-6 中 有 两 个 1:1 关 系 : Staff Manages Clinic 和 Invoice ResultsFrom Examination。 但 
是 ， 在 这 两 个 例子 中 ， 两 个 实体 显然 不 同 ， 因此 不 应 该 合并 在 一 起 。 | | 
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2. 宛 余 关系 

在 图 17-6 中 ， 在 PetOwner、Pet、Clinic 和 Appointment 之 间 有 一 些 关 系 ， 同 时 ， 最 近 的 一 
次 检查 对 于 标识 出 任何 元 余 关 系 是 很 有 用 的 。 首 先 ， 注意 到 PetOwner/Pet 实 体 在 
POAttends/PAttends /Owns 关 系 中 为 强制 参与 ， 同 时 ， 由 于 一 个 PetOwner 可 能 拥有 许多 宠物 
(Pet)。 因 此 ， 对 任何 一 个 给 定 的 Appointment， 我 们 都 通过 POAttends 关 系 来 标识 Owner， 但 不 
能 通过 Owns 关 系 来 标识 Pet。 然 而 ， 对 任何 给 定 的 Appointment， 可 以 通过 PAttends 关 系 来 标 
识 Pet; 对 任何 给 定 的 Pet， 可 以 通过 Owns 关 系 来 标识 PetOwner。 这 就 说 明 POAttends 关 系 是 元 
余 的 。 同 样 ， 通 过 PAttends 关 系 ， 可 以 标识 Pet; 通过 Registers 关 系 ， 可 以 标识 包含 在 
Appointment 中 的 Clinic。 这 表明 Schedules 关 系 也 是 元 余 的 。 

注意 到 Clinic 和 PetOwaner 之 间 的 IsContactedBy 关 系 似乎 也 是 元 余 的 。 但 是 ， 当 宠物 主 
人 第 一 次 与 诊所 关系 时 ，Perfect pets 记 录 了 宠物 主人 的 详细 信息 ， 但 只 有 当 第 一 次 预约 的 
时 候 才 获得 宠物 的 详细 信息 ， 所 以 要 留 下 IsContactedBy 关 系 。 修 正 后 的 逻辑 数据 模型 如 图 
17-7 所 示 。 


17.2.8 步骤 1.8: 检查 模型 是 否 支持 用 户 事务 


在 这 个 步骤 中 ， 检 查 已 经 创建 的 局 部 逻辑 数据 模型 是 否 支持 用 户 所 需 的 事务 。 检 查 包括 
如 下 方面 : 

。 数 据 模型 中 是 否 存在 必需 的 属性 。 

* 如 果 属 性 要 从 多 个 实体 中 得 到 ， 则 两 个 实体 之 间 是 否 有 通路 ; 换 名 话说， 在 两 个 实体 之 

间 要 有 已 经 标识 了 的 关系 ， 不 论 是 直接 的 还 是 间接 的 。 

17.1.2 节 中 所 标识 的 查询 事务 的 路 径 图 如 图 17-8 所 示 ， 你 可 以 很 容易 地 通过 一 个 或 多 个 关 
系 检查 是 否 可 以 从 一 个 实体 或 从 多 个 实体 得 到 所 必需 的 属性 。 


17.2.9 步骤 2.1: 创建 表 


在 这 个 步 允 中 ， 从 逻辑 数据 模型 创建 表达 用 户 视图 中 所 描述 的 实体 和 关系 的 表 ， 这 时 ， 
要 为 关系 数据 库 使 用 数据 库 设 计 语 言 (DBDL )。 

将 表 和 外 键 属性 存档 

在 步骤 2.1 的 最 后 ， 将 从 有 辑 数据 模型 创建 的 表 的 全 部 结构 都 存档 。 每 个 表 的 DBDL 描 述 
如 图 17-9 所 示 。 


17.2.10 步骤 2.2: 用 规范 化 方法 检查 表 结 构 


在 这 个 步骤 中 ， 要 确保 上 一 步 所 建 的 表 至 少 要 满足 第 三 范式 (3NF)。 如 果 发 现 了 不 满足 
第 三 范式 的 表 ， 则 可 能 表明 逻辑 数据 模型 中 的 某 些 部 分 是 错误 的 ， 或 者 是 从 模型 产生 表 的 时 
候 产 生 了 错误 。 然 而 ， 图 17-9 中 所 标识 的 表 确 实 是 满足 3NF 的 。 


17.2.11 步骤 2.3: 检查 模型 是 否 支 持 用 户 事 务 


这 个 步 喉 与 步骤 1.8 类 似 ， 在 这 个 步骤 中 ,除了 要 检查 从 实体 到 表 的 映射 关系 并 且 要 确定 
外 键 之 外 ， 在 这 个 情景 下 ， 还 可 以 再 次 检查 从 实体 到 表 的 映射 是 否 正确 地 完成 ， 以 及 所 创建 
的 表 是 否 支持 17.1.2 节 中 标识 的 用 户 事 务 。 
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Staff (staffNo, SEName, sLName, sStreet, stity, 
sstate, szipCode, sTelNo, DOB, sex, SSN, position, 
salary, clinicNoy 

Primary Key staffNa 

Aiterrate Key SSN 

Foreign Key clinicNo references ClinictclinicNo) 

















Forelgn Key mgritaffNo references StafftstaffNo) 







Pet (petNo, petName, petType, petDescription, PDOB, 
dateRegistered, petStatus ownerNo, cinicNo} 
Primary Key petNo 

Foreign Key ownerNo references Owner(OwnerNo} 
Foreign Key clinicNo references Clinic(clmicNo) 











PetOwner (ownerNo, oFName, ol Name, oState, OZipCede， 
oTelNo, clinicNo} 


Primary Key ownerNo 
Foreign Key clinicNo references Clinic(clinicNo} 











Treatment (treatNo, description, cost) 
Primary Key treatNo 







Examination (examNo, examDate, 
examThme. examResults, petNo, staffNo} 
Primary Key examNo 

Alternate Key statfNo, examDate, exam Tigre 
Foreign Key petNo references Pet(petNo) 
Foreign Key staffNo references StafRstaffNo) 


Pen {penNo, penCapacity, penStatus, ciinicNoy PetPen (penNo, petNo, dateln, dataOut, comments) 
Primary Key penNo Primary Key penNo, petNo, dateln 
Foreign Key clinicNo references ClinictclinicNo) Alternate Key penNo, petNo, dateOnut 



















Kem titemNo, itemName, iteniDescription, itemCost) 
Primary Key ibunNo 


PetTreatment (examNo., treatNo, startDate endDate, 
Quantity, ptComments} 

Primary Key examNo, treatNo 

Foreign Key examNo references Examination(examNo} 
Foreign Key treatNo references Treatment{treatNo} 


Pharmacy (drugNo, drugName, drugDescription dosage, temClinicStock (temNo, cinicNo, inStock, 
methodAdmin, drugCost) reonderLevel, reorderQty} 

Primary Key drugNo Primary Key HemNo, cinicNo 

Foreign Key itemNo references item(itemNo) 
Foreign Key clinicNo references Clinic(cHnicNo) 






























PharmCHinicStock (dmgNo, clinicNo, inStock, 
reorderLevel, } paymentMethod, ownerNo, examNo) 

Primary Key dngNo, cinicNo Primary Key jinvolceNo 

Foreign Key drugNo references Pharmacy(drugNo} Foreign Key ownerNo references OwnerfownerNo) 
Foreign Key clinicNo references Clinic(ciinicNo} Foreign Key examNo references ExaminationtexamNo 


Appointment (appNo, aDate, aTime, petNo} 
Primary Key appNo 
Foreign Key petNo references Pet(petNo) 


Invoice (involceNo invoiceDate, datepaid， 
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图 17-9 从 Perfect Pets 逻 辑 数据 模型 创建 的 才 








17.2.12 步骤 2.4: 检查 业务 规则 


业务 规则 是 为 了 防止 数据 库 不 一 致 而 强加 的 约束 。 六 种 完整 性 约束 中 ， 有 四 种 在 上 一 步 
已 经 标识 了 ， 并 且 存 档 在 数据 字典 中 。 这 四 种 是 ， 需 要 的 数据 、 属 性 域 约束 、 实 体 完整 性 和 
多 样 性 。 剩 下 的 两 种 为 :参照 完整 性 和 其 他 业务 规则 ， 

1. 参照 完整 性 

在 这 里 要 考虑 两 点 : 

“标识 外 键 是 否 可 以 为 空 (NULL)。 通 常 ， 如 果 关 系 中 子 表 部 分 是 强制 的 ， 那 么 就 不 多 

许 为 空 。 如 果子 表 部 分 是 可 选 的 ， 那 么 就 允许 为 空 。 

“ 标识 现 有 约束 条 件 ， 表 明 外 键 的 插入 、 更 新 或 删除 情况 。 通 常 ， 要 为 每 个 外 健明 确 说 明 丙 

个 动作 : 一 个 是 ON UPDATE 动 作 ， 为 一 个 是 ON DELETE 动 作 ， 用 于 表明 当 在 父 表 中 更 新 
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或 删除 一 条 记录 时 ， 如 何 保证 参照 完整 性 。 图 17-10 说 明了 图 17-9 中 标识 的 外 键 所 需 的 必 
要 动作 。 
2. 其 他 业务 规则 
最 后 ， 考 虑 是 否 还 有 在 Perfect Pets 定 义 了 但 还 没有 在 数据 模型 中 描述 的 其 他 类 型 的 约束 。 
这 样 的 约束 一 般 被 称 为 业务 规则 。 
3. 将 所 有 的 业务 规则 存档 
为 了 考虑 物理 数据 库 设 计 ， 应 该 在 数据 字典 中 记录 所 有 的 业务 规则 。 


ee 


Clinic 

Foreign Key mgrStaffNo references Staff(staffNo) ON UPDATE CASCADE ON DELETE NO ACTION 

Staff 

Foreign Key clinicNo references Clinic(clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 
PetOwner 

























Foreign Key clinicNo references Clinit(clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 
| Pet 
Foreign Key ownerNo references Owner(ownerNo) ON UPDATE CASCADE ON DELETE CASCADE 
sy ClinicNo references Clin clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 
references 


Pen 
Foreign Key clinicNo references Clinic(clinicNo) ON UPDATE CASCADE ON DELETE CASCADE 


Examination 
Foreign Key petNo references Pet(petNo) ON UPDATE CASCADE ON DELETE CASCADE 
Foreign Key staffNo references Staff(staffNo) ON UPDATE CASCADE ON DELETE NO ACTION 
PetPen 
Foreign Key references Pen(penNo) ON UPDATE CASCADE ON DELETE CASCADE 
Foreign Key petNo references Pet(petNo) ON UPDATE CASCADE ON DELETE CASCADE 
Clinict 


penNo 
PetTreatment 
Foreign Key treatNo references Treatment(treatNo) ON UPDATE CASCADE ON DELETE NO ACTION 
KtemClinicStock 
Foreign Key itemNo references Item(itemNo) ON UPDATE CASCADE ON DELETE NO ACTION 
Foreign Key clinicNo clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 
PharmClinicStock ， 
Foreign Key drugNo references PharmacytdrugNoj ON UPDATE CASCADE ON DELETE NO ACTION 
Foreign Key clinicNo references Clinic(clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 
Invoice 


Foreign Key ownerNo references Owner(ownerNo) ON UPDATE CASCADE ON DELETE NO ACTION 
Foreign Key examNo references Examination(examNo) ON UPDATE CASCADE ON DELETE NO ACTION 
Appointment 2 

Foreign Key petNo references PettpetNo) ON UPDATE CASCADE ON DELETE CASCADE 











图 17-10 Perfect Pets 表 的 参照 完整 性 约束 


17.2.13 步骤 2.5: 与 用 户 一 起 讨论 逻辑 数据 库 设计 


现在 ， 逻 辑 数据 库 设计 已 经 完成 并 存档 。 这 时 ， 应 该 与 用 户 一 同 检查 模型 和 支持 文档 。 
我 们 假定 在 设计 中 并 没有 发 现 什么 大 的 问题 。 到 目前 为 止 我 们 已 完成 了 Perfect Pets 的 逻辑 数 
据 库 设计 。 在 下 一 章 ， 我 们 将 继续 进行 物理 数据 库 设计 阶段 。 





第 18 章 Perfect Pets 一 一 使 用 物理 数据 库 设 计 方 法 学 


在 这 一 章 中 ， 我 们 为 第 17 章 的 Perfect Pets 示 例 继续 完成 物理 数据 库 设 计 。 为 了 说 明 某 些 物 
理 的 实现 ， 我 们 使 用 Oracle 9i。 正 如 我 们 在 第 17 章 的 开始 所 提 到 的 那样 ， 我 们 建议 在 阅读 本 章 
前 ， 自 己 按 步骤 做 一 下 。 然 后 可 以 对 照 我 们 例子 的 解决 方法 来 检查 你 自己 的 方法 。 如 果 你 不 熟 
悉 文 件 组 织 和 检索 ， 可 以 先 阅读 附录 D。 你 会 发 现 附录 B 的 方法 学 总 结 也 是 很 有 帮助 的 。 

在 本 章 ， 我 们 要 完成 物理 数据 库 设 计 方 法 学 中 的 步骤 ， 为 Perfect Pets 数 据 库 提出 合适 的 
物理 设计 。 


18.1 步骤 3.1: 设计 基本 表 


在 逻辑 数据 库 设计 阶段 ， 创 建 了 一 些 描述 逻辑 数据 模型 中 的 实体 和 关系 的 基本 表 的 设计 包括 : 

* 对 于 每 个 表 ， 包 括 它 的 属性 、 主 键 、 备 用 键 、 外 键 和 完整 性 约束 。 

* 对 每 个 属性 ， 包 括 它 的 域 、 可 选 的 默认 值 、 是 否 可 以 为 空 和 是 否 是 派生 的 。 

基本 表 的 设计 还 包括 ， 使 用 这 些 信 息 去 定义 域 、 默 认 值 和 空 指示 符 。 例 如 ， 对 Perfect 
Pets 的 Pen 表 ， 可 以 使 用 扩展 的 数据 库 设计 语言 (DBDL) 产生 如 图 18-1 所 示 的 设计 。 使 用 这 
个 信息 可 以 确定 在 目标 DBMS 中 如 何 实现 基本 表 ， 在 这 个 例子 中 是 Oracle 9i。 









固定 长 度 字符 串 ， 长 度 为 4 


domain Pen_Numbers 










domain Pen_Capacity 1~4 之 间 的 整数 ， 

domain Pen_Status 一 个 字符 ， 表 明 围 栏 是 否 可 获得 ， 可 获得 为 A， 不 可 获得 为 N 

domain Clinic_Numbers 固定 长 度 字 符 串 ， 长 度 为 5 

Pen( penNo Pen_Numbers NOT NULL， 
penCapacity Pen_Capacity NOT NULL DEFAULT 2, 
penStatus Pen_Status NOT NULL DEFAULT ‘A’, 
clinicNo Clinic_Numbers NOT NULL) 






Primary Key penNo 
Foreign Key clinicNo References Clinic (clinicNo) ON UPDATE CASCADE ON DELETE NO ACTION 





图 18-1 Pen 表 的 DBDL 


1. 在 Oracle 9i 中 创建 基本 表 

在 一 些 系统 中 ， 不 能 完全 遵循 1999 SQL 标准 (SQL3)， 不 支持 PRIMARY KEY、 
FOREIGN KEY 和 DEFAULT 中 一 条 或 更 多 条 子 句 。 同 样 ， 许 多 系统 不 支持 域 .但 是 ，Oracle 
9i 支持 SQL3 中 许多 CREATE TABLE 语 句 ， 因此 可 以 这 样 定 义 : 

* 主键 ， 使 用 PRIMARY KEY 子 句 。 

“备用 键 ， 使 用 UNIQUE 关 键 字 。 

* 默认 值 ， 使 用 DEFAULT 子 句 。 

“ 非 空 列 ， 使 用 NOT NULL 关 键 字 

。 外 键 ， 使 用 FOREIGN KEY 子 句 。 
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。 其 他 列 或 表 约 束 ， 使 用 CHECK 和 CONSTRAINT 子 句 。 
但 是 ， 尽 管 Oracle 9i 确 实 人 允许 创建 用 户 自 定义 类 型 ， 但 数据 类 型 与 SQL 标准 稍 有 不 同 ， 如 
表 18-1 所 示 。 
表 18-1 部 分 Oracle 数 据 类 型 





数据 类 型 用 法 长 度 
char(size) 存储 定 长 字符 数据 (默认 长 度 是 1) 最 多 2000 字 节 
nchar(size) 除 最 大 长 度 由 数据 库 字 符 集 ( 例 如， 美式 英语 、 东 欧 语言 
或 韩语 ) 确定 之 外 ， 其 他 与 char 型 相间 

varchar2(size) 存储 变 长 字符 数据 最 多 4000 字 节 

nvarchar2(size) 与 varchar2 型 相同 ， 最 大 长 度 与 nchar 相 同 

varchar 目前 与 char 型 相同 ， 但 建议 使 用 varchar2 ， 因 为 varchar 串 能 最 多 2000 字 地 
变 成 独立 的 数据 类 型 ， 在 以 后 的 发 布 中 有 不 同 的 比较 语义 

number(1,d) 存储 定点 或 浮 点 数字 ，1 代 表 长 度 ，d 代 表 小 数位 的 长 度 。 1.0E — 130 
例如 、number(5,2) 型 数据 最 大 不 超过 999.99 

decimal(l,d)、dec(l,d) 与 number 相 同 ， 与 SQL 标准 兼容 

或 numeric(l.d) 

integer、int、smallint 与 SQL 标准 兼容 ， 转 化 为 number(38) 

date 存储 的 日 期 从 公元 前 4712 年 1 月 1 日 到 4712 年 12 月 31 晶 

blob 一 个 二 进 制 大 对 象 最 多 4GB 

clob 一 个 字符 大 对 象 最 多 4GB 

raw(size) 原始 二 进 制 数 据 ， 例 如 图 形 字 符 或 数字 化 图 片 最 多 2000 字 节 


在 第 12 章 ， 我 们 看 到 Microsoft Access 有 - -个 Autonumber( 自 动 序 序列 号 ) 数 据 类 型 ， 全 和 
每 当 插入 一 条 记录 时 ， 都 为 某 列 生成 一 个 新 的 序列 号 。Oracle 没 有 这 样 的 数据 类 型 ， 但 它 
( 非 标准 ) SQL CREATE SEQUENCE 语句 具有 相似 的 功能 。 例 如 ， 语 句 : 


CREATE SEQUENCE appNoSed 
START WITH 1 INCREMENT BY 1 CACHE 30; 


创建 一 个 叫做 appNoSeq 的 序列 ， 初 始 值 为 1， 每 次 加 1。CACHE 30 子 句 说 明 Oracle 应 该 预 
先 分 配 30 个 序列 号 ， 并 为 了 提高 访问 速度 ， 将 他 们 保存 在 内 存 中 。 

一 且 创 建 了 序列 号 ， 就 可 以 在 SQL 语句 中 用 下 述 的 伪 列 来 访问 它 的 值 : 

“CURRVAL 返回 序列 中 的 当前 值 。 

*NEXTVAL 增加 序列 中 的 值 ， 并 返回 新 值 。 

例如 ，SQL 语 句 : 

INSERT INTO Appointment (appNo,adate,aTime,petNo) 

VALUES (appNoSedq .NEXTVAL, SYSDATE, “12.00'，'010090'); 


这 条 语句 向 Appointment 表 中 插入 一 条 新 记录 ， 并 置 appNo (预约 号 ) 列 的 值 为 序列 中 的 
下 一 个 可 用 值 。 

2. 使 用 SQL*PLUS 在 Oracle 9i 中 建立 空 

为 了 说 明 在 Oracle 中 建立 空 表 的 过 程 ， 我 们 首先 使 用 SQL*PLUS， 它 是 交互 的 、 由 命令 行 驱动 
的 到 Oracle 数 据 库 的 SQL 接口 。 图 18-2 说 明了 如 何 使 用 Oracle SQL CREATE TABLE 语 名 创建 Pen 表 。 

Oracle 允 许 指定 的 约束 有 效 (默认 设置 ) 和 无 效 。 在 某 些 情况 下 ， 由 于 功能 原因 ， 可 能 要 
暂时 使 约束 无 效 。 例 如 : 
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‘SsQLxplus: Release 9.8.1.3.8 - Production on Mon Nov 18 11:12:83 2882 
(c) Copyright 2881 Oracle Corporation. All rights reserved. 


Connected to: 

Personal 0racle9i Release 9.2.8.1.8 ~ Production 

With the Partitioning, OLAP and Oracle Data Mining options 
JSeruer Release 9.2.8.1.8 ~ Production 


SQL> CRERTE TABLE Pen 
2 penNo CHARCGSH)} NOT NULL , 
3 penCapacity NUMBER DEFAULT 2 NOT NULL 
| CHECK (penCapacity BETHEEN 1 AND 5}, 
.5 penstatus CHAR DEFAULT ‘f° NOT NULL 
| & CHECK (penStatus = ‘Af' QR penSstatyus = “HN’}, 
7 了 7 clinicHo CHhRtS》 HOT NULL ， 
8 PRINARY KEY (penNo}, 
9 CONSTRAINT clinicnymber3 FOREIGH KEY (clinicHo) 
.18 REFERENCES Clinic{clinicNo}}; 


Table created. 


‘SQL> 






图 18-2 使 用 Oracle SQL CREATE TABLE 语 句 创建 Pen 表 


" 使 用 SQL*Loader 向 表 中 装载 大 量 数据 。 

“执行 批 处 理 ， 对 表 进行 很 大 量 的 更 改 。 

* 同时 对 一 张 表 进行 导入 和 导出 。 

默认 时 ，Oracle 强 制 在 定义 的 外 键 上 保证 参照 完整 性 。 因 此 ， 它 强制 执行 参照 动作 ON 
DELETE NO ACTION 和 ON UPDATE NO ACTION。 同 时 ， 它 也 允许 指定 附加 的 ON DELETE 
CASCADE 子 名 (允许 从 父 表 中 删除 数据 时 级 联 删 除 子 表 中 相应 数据 ) 和 ON DELETE SET 
NULL 子 句 〈 人 允许 从 父 表 删除 数据 ， 并 将 子 表 中 相应 的 外 键 值 置 为 NULL)。 但 它 不 支持 ON 
UPDATE CASCADE 动 作 和 SET DEFAULT 动 作 ， 如 果 需 要 这 些 动作 ， 则 必须 考虑 用 触发 器 实 
现 或 者 用 应 用 程序 代码 实现 。 我 们 将 在 步骤 3.3 对 此 做 简单 考虑 。 

3. 使 用 表 向 导 来 建 表 

在 Oracle 9i 中 可 以 使 用 “ 表 向 导 ”(Table Wizard) 来 建 表 ， 它 是 企业 管理 控制 台 ( Enterprise 
Manager Console) 的 一 部 分 。 使 用 交互 界面 ,“ 表 向 导 ” 引 导 你 一 步 步 完成 对 每 个 列 的 定义 ， 包 
括 数据 类 型 、 定 义 列 上 的 约束 和 表 上 的 约束 以 及 关键 字 域 。 图 18-3 显 示 了 “ 表 向 导 ” 在 创建 
Treatment 表 时 的 最 终 形式 。 

4. 将 基本 表 设 计 存 档 

基本 表 设计 也 应 该 将 表 以 及 选择 某 设计 的 原因 存档 。 尤 其 是 当 存在 多 个 选择 时 ， 将 选择 
其 中 一 种 方法 的 原因 存档 。 


18.2 步骤 3.2: 设计 派生 数据 的 表示 


17.1.1 节 给 定 的 需求 表明 只 有 一 个 派生 项 ， 也 就 是 账单 上 要 记录 的 给 宠物 进行 所 有 诊治 的 
总 费用 。 获 得 该 信息 的 算法 可 以 写成 如 下 SQL 语句 。 
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图 18-3 使 用 Oracle 创 建 表 向 导 创 建 Treatment 表 


SELECT SUM (pt .quantity*t.cost) 

FROM Invoice i , Examination e, PetTeatment pt, Treatment 上 

WHERE i .examNo=e.examNo AND e.examNo=pt .examNo AND 
pt.treatNo=t.treatNo; 


如 果 经 常 访问 Invoice 表 ， 那么 将 总 费用 存在 Invoice 表 中 可 以 提高 系统 性 能 。 但 是 ， 从 预 
期 的 频 度 来 看 (参见 本 章 后 边 的 表 18-2)， 并 不 是 经 常 要 访问 Invoice 表 ， 在 这 种 情况 下 ， 只 要 在 
需要 的 时 候 计算 总 费用 就 可 以 了 。 


18.3 步骤 3.3: 设计 其 他 业务 规则 


有 时， 更 改 表 可 能 会 受 业 务 规则 的 限制 。 这 些 规则 的 设计 也 依赖 于 目标 DBMS 。 有 些 系 
统 在 定义 规则 方面 比 另 一 些 系统 提供 了 更 多 的 功能 。 在 第 12 章 中 ， 我 们 看 到 如 果 系 统 遵 循 
1999 SQL 标准 ， 则 某 些 规则 可 能 更 容易 实现 。 正如 我 们 在 前 面 所 看 见 的 ，Oracle 9i 人 允许 将 定 
义 约束 的 CHECK 和 CONSTRAINT 子 句 作 为 SQL CREATE TABLE 语 句 中 的 一 部 分 ， 也 允许 使 
用 before triggers (前 触发 器 ) 和 after triggers (后 触发 器 ) 定义 其 他 约束 。 为 了 更 灵活 ， 
Oracle 9i 允 许 创 建 存储 过 程 ， 并 可 以 在 SQL 中 调用 它 。 

例如 ， 图 18-1 中 的 Pen 表 的 外 码 clinicNo ， 就 应 该 有 ON UPDATE CASCADE 动 作 。 但 是 ， 
正 像 我 们 已 经 注意 到 的 ，Oracle 的 CREATE TABLE 语 句 不 支持 该 动作 。 但 是 ， 可 以 使 用 触发 
器 来 实现 该 动作 ， 如 图 18-4 所 示 。 
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--Before the clinicNo column is updated in the Pen table, fire this trigger 


i i i i inic table. 
~-to verify that the new foreign key value is present in the Clinic ~ 
Y Before 触 发 器 


CREATE TRIGGER Pen_Clinic_Check_Before 
BEFORE UPDATE OF clinicno ON pen 
触发 触发 器 
的 条 件 





FOR EACH ROW WHEN (new.clinicno IS NOT NULL) 
DECLARE 
dummy CHAR(5); 
invalid._clinic EXCEPTION; 
valid_clinic EXCEPTION; 
mutating_table EXCEPTION; 
PRAGMA EXCEPTION_INIT (mutating_table,-4091); 
--Use cursor to verify parent key value exists. 
--Use FOR UPDATE OF to lock parent key's record so that it cannot be deleted 
~-by another transaction before this transaction completes. 
CURSOR update_cursor (sn CHAR(S5)}) IS 
SELECT clinicno FROM clinic 
WHERE clinicno = sn 
FOR UPDATE OF clinicno; 
BEGIN 
OPEN Update_cursor (:new.clinicno); 
FETCH update cursor INTO dummy; 
--Verify parent key. Raise exceptions as appropriate. 
IF update_cursor%NOTFOUND THEN 
RAISE invalid clinic; 









行 级 触发 器 








ELSE 
RAISE valid_ clinic; 指定 的 clinicNo 
END IF; 无 效 
CLOSE updaate_cursor: 
EXCEPTION 


WHEN invalidq_clinic THEN 
CLOSE update_cursor; 
raise_application_error(-20000, ‘Invalid Clinic Number’'||:new.ciinicno); 
WHEN Valid_clinic THEN.: 
CLOSE update_cursor; 
--A mutating table is a table that is currently being modified by an INSERT, UPDATE, 
--Or DELETE statement, or one that might need to be updated by the effects of a declarative 
~~DELETE CASCADE referential integrity constraint. 
--This error would raise an exception, but in this case the exception is OK, so trap it, 
-~-but don't do anything. 
WHEN mutating_table THEN 
NULL; 
END; 


| a) Pen 表 的 触发 器 
-~-Create a Sequence number and a public variable UPDATESEQ. 


CREATE SEQUENCE updatesequence INCREMENT BY 1 MAXVALUE 500 CYCLE; 
CREATE PACKAGE seqpackage AS 
updateseq NUMBER; 
END seqpackage; 
CREATE Or REPLACE PACKAGE BODY seqpackage AS END Seqpackage; 













存储 序列 号 的 包 


给 Pen 表 添加 
额外 的 列 


~-Before updating the Clinic table using this statement trigger, generate a new 
--sequence number and assign it to the public variable UPDATESEQ. 
CREATE TRIGGER Cascade_ClinicNo_Updatel 
BEFORE UPDATE OF clinicno ON clinic 
DECLARE 
dummy NUMBER; 


图 18-4 当 Clinic 表 中 的 主键 更 新 时 ，Oracle 触 发 器 强制 Pen 表 中 的 外 键 clinicNo 执 行 
ON UPDATE CASCADE 动 作 









--Add a new column to the Pen table to flag changed records. 
ALTER TABLE pen ADD updateid NUMBER; 












语句 级 的 Before 
触发 器 
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.NEXTVAL yp » 
SELECT updatesequence.NEX 为 更 新 设置 新 的 
INTO dummy FROM dual; 序列 号 
Seqpackage .updateseq :=dummy; 


~-Create a row after-trigger that cascades the Update to the Pen table. 
--Only cascade the update if the child row has not already been updated by the trigger. 


CREATE TRIGGER Cascade_ClinicNo Update2 
AFTER UPDATE OF clinicno ON clinic 行 级 的 After 
FOR EACH ROW . > 触发 器 
BEGIN 


UPDATE pen SET clinicno = :new.clinicno, updateiqd = segqpackage .updateseqg 
WHERE pen.clinicno = :old.clinicno AND updateid IS NULL; 
END; 
















BEGIN 
















为 这 些 记 录 更 新 Pen 
表 并 设置 更 新 标志 






--Create a final statement after-trigger to reset the updateiqd flags 
CREATE TRIGGER Cascade_ClinicNo_Update3 
AFTER UPDATE OF clinicno ON ciinic 
BEGIN 






UPDATE pen SET updateid = NULL 


语句 级 的 After 触 发 器 。 重 
WHERE updateid = seqpackage .updateseq; 


新 设置 更 新 后 记录 的 标志 








END; 
b) Clinic 表 的 触发 器 
图 18-4 《 续 ) 


1. 触发 器 1 (Pen_Clinic_Check_Before ) 

每 当 更 新 Pen 表 中 的 clinicNo 列 时 ， 都 会 激活 图 18-4a 中 的 触发 器 。 在 更 新 发 生 之 前 ， 触 发 
器 检查 指定 的 新 值 是 否 存在 于 Clinic 表 中 。 如 果 引 发 了 Invalid_Clinic 异 常 ， 触 发 器 就 发 出 一 个 
错误 信息 ， 并 防止 更 新 的 发 生 。 应 该 注意 下 面 的 几 点 : 

“ BEFORE 关键 字 表 明 触 发 器 应 该 在 更 新 Pen 表 中 的 clinicNo 列 之 前 执行 。 

“FOR EACH ROW 关键 字 表 明 这 是 一 个 行 级 触发 器 ， 表明 在 一 个 事务 中 更 新 Pen 表 的 每 一 
行 时 ， 都 要 执行 该 触发 器 。 与 此 对 应 的 触发 器 的 类 型 还 有 语句 级 触发 器 ， 它 对 每 个 事务 
执行 一 次 。 我 们 将 很 快 看 到 语句 级 触发 器 的 例子 。 

* WHEN 子 句 指明 激活 触发 器 的 条 件 。 

* new 关 键 字 用 于 指向 该 列 的 新 值 ， old 关 键 字 用 于 指向 该 列 的 旧 值 。 

2. 修改 Clinic 表 以 支持 触发 器 

每 当 更 新 Clinic 表 中 的 cliniceNo 列 时 ， 都 会 激活 图 18-4b 所 示 的 三 个 触发 器 。 在 定义 触发 器 

之 前 ， 创 建 了 一 个 序列 号 一 -updateSequence (更 新 序列 ) 以 及 一 个 公共 变量 updateSeq ( 通 
过 seqPackage 包 ， 三 个 触发 器 可 以 访问 该 变量 )。 另外 ， 修 改 Pen 表 增加 一 个 叫做 updated 的 列 ， 
用 该 列 作为 是 否 已 更 新 记录 的 标志 ， 以 防止 在 级 联 操作 中 多 次 更 新 记录 。 

3. 触发 器 2 (Cascade_ClinicNo_Updatel ) 

在 更 新 Clinic 表 的 ClinicNo 列 之 前 ， 激活 语句 级 触发 器 Cascade_ClinicNo_Updatel ， 设 置 

新 的 用 于 更 新 的 序列 号 。 - 
4. 触发 器 3 ( Cascade_ClinicNo_Update2 ) 


激活 行 级 触发 器 Cascade_ClinicNo_Update2， 用 于 将 Pen 表 中 所 有 含有 用 值 的 记录 中 上 朋 的 
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clinicNo 值 (:old.clinicno ) 更 新 为 新 值 (:new.clinicno)， 并 且 标 志 已 经 更 新 该 记录 。 
5. 触发 器 4 (Cascade_ClinicNo_Update3 ) | 
更 新 后 ， 激 活 最 后 一 个 语句 级 触发 器 Cascade_ClinicNo_Update3， 将 更 新 记录 的 标志 恢复 
为 没有 更 新 。 
不 用 太 关 心 触发 器 的 工作 细节 。 最 应 该 注意 的 是 ， 实现 这 些 动作 所 必需 的 大 量 的 
编程 工作 。 换 向 话说 ， 想 一 想 ， 如 果 DBMS 提 供 了 这 些 功 能 ， 可 以 节省 多 少 工作 ， 










18.4 步骤 4.1: 分 析 事务 


创建 了 基本 表 、 完 整 性 约束 和 业务 规则 后 ， 下 一 步 就 是 分 析 事 务 为 每 个 基本 表 确 定 合适 
的 文件 组 织 方式 和 索引 。 假 定 17.1.2 节 所 标识 的 事务 Perfect Pets 是 最 重要 的 事务 。 为 了 集中 在 
可 能 会 出 现 问题 的 区 域 ， 我 们 在 第 13 章 中 建议 的 继续 进行 的 一 个 方法 是 : 

1) 将 所 有 的 事务 路 径 映 射 到 表 。 

2) 确定 最 常 被 事务 访问 的 表 。 

3) 分 析 涉 及 到 这 些 表 的 事务 。 

在 步 又 1.8 和 2.3 中 ， 已 经 完成 了 第 一 步 ( 见 图 17-9)。 为 了 实现 第 二 步 ， 需 要 估计 和 名表 的 
访问 频率 。 如 果 可 能 ， 应 该 把 频率 信息 加 入 到 事务 路 径 图 中 。 但 这 有 时 会 使 该 图 混乱 而 难于 
解释 ， 所 以 你 可 能 更 想 单独 保存 这 些 频 率 信息 。 在 讨论 了 Perfect Pets 中 的 员工 后 ， 得 到 的 频 
率 信息 如 图 18-5 所 示 。 

此 外 ， 必 须 估计 每 个 事务 可 能 的 频率 。 分 析 所 有 这 些 信息 以 标识 需要 特殊 考虑 的 地 方 。 


18.5 步骤 4.2: 选择 文件 组 织 方式 


加 果 目 标 DBMS 人 允许， 这 步 的 目标 就 是 为 每 张 表 选 择 最 佳 的 文件 组 织 方式 。 为 了 完成 此 
步 蛇 ， 需 要 理解 目标 DBMS 在 逻辑 和 物理 两 层 上 是 如 何 操作 的 。 在 这 个 步 踊 中 ， 我 们 查看 
macle 是 如 何 存储 数据 的 。 这 实际 上 是 技术 上 的 讨论 ， 但 是 可 以 帮 你 了 解 例子 中 这 步 所 种 的 知 
识 的 类 型 。 

1. Oracle 的 逻辑 数据 库 结构 

在 逻辑 层 ，Oracle 维 护 表 空 间 、 模 式 、 数据 块 和 区 (extent) / 段 《segment) ， 下 面 我 们 来 
解释 它们 。 

(1) 表 空 间 

Oracle 数 据 库 被 划分 成 逻辑 存储 单元 ， 称 为 表 空 间 。 表 空间 用 于 把 相关 的 数据 结构 组 织 在 
起。 例如， 表 空间 通常 把 应 用 中 的 所 有 对 象 组 织 在 一 起 ， 以 简化 一 些 管理 操作 ， 

于 个 Oracle 数 据 库 都 包含 一 个 叫做 SYSTEM 的 表 空 间 ， 它 是 数据 库 创建 时 自动 生成 的 
”MM 表 空间 总 是 包含 整个 数据 库 的 系统 目录 (在 1.2.1 节 定义 ) 表 。 一 个 小 型 数据 库 可 能 
“需要 SYSTEM 直 空间 ， 但 是 ， 建 议 你 至 少 要 创建 一 个 表 空 间 来 单独 存储 用 户 的 数据 ， 以 减 
信 对 了 相同 数据 文件 ( 见 图 16-1) 中 字典 对 象 和 模式 对 象 之 间 的 争 用 。 图 18-6 说 明了 个 包 
含 SYSTEM 表 空间 和 USER_DATA 表 空间 的 Oracle 数 据 库 ， ， 

可 用 CREATE TABLESPACE 命 令 创建 一 个 新 的 表 空间 。 例 如 : 


CREATE TABLESPACE USERS 
DATAFILE 'DATA3.ORA' SIZE 100K; 


二 个 实例 


咽 五 这 分 帮 
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图 18-6 一 个 Oracle 数 据 库 、 表 空间 和 数据 文件 之 间 的 关系 
用 CREATE TABLE 或 ALTER TABLE 语 句 可 使 一 张 表 与 某 一 表 空 间 联 系 起 来 。 例 如 : 


CREATE TABLE Penl(penNo CHAR(4) NOT NULL,...) 
TABLESPACE USERS; 


如 果 创 建新 表 时 没有 指明 表 空 间 ， 就 使 用 用 户 账号 创建 时 与 用 户 相 关联 的 默认 表 空 间 。 
我 们 将 在 步骤 6 中 看 到 如 何 指定 用 户 账号 的 表 空间 。 

(2) 用 户 、 模 式 和 模式 对 象 

用 户 (user) (有 时 称 为 用 户 名 username) 是 在 数据 库 中 定义 的 一 个 名 字 ， 该 名 字 可 以 连 
接 和 访问 对 象 。 模 式 (schema) 是 对 象 的 一 个 命名 的 集合 ， 例 如 与 某 特 定 用 户 相关 联 的 表 、 
视图 、 聚 灸 和 过 程 等 。 模 式 和 用 户 帮助 DBA( 数 据 库 管理 员 ) 管 理 数据 库 安 全 。 

为 了 访问 数据 库 ， 用 户 必 须 运行 一 个 数据 库 应 用 (比如 Oracle 窗 体 或 SQL*PLUS )， 并 
且 用 数据 库 中 已 定义 的 用 户 名 与 数据 库 进行 连接 。 当 创建 了 一 个 数据 库 用 户 时 ， 就 为 用 户 
创建 了 一 个 同名 的 相应 模式 。 默 认 时 ， 一旦 用 户 连接 到 数据 库 ， 这 个 用 户 就 可 以 访问 相应 
模式 中 所 包含 的 全 部 对 象 。 由 于 用 户 只 与 同名 的 模式 相 联 ， 因 此 术语 用 户 和 模式 经 常 是 可 
以 替换 的 。 

注意 在 表 空 间 和 模式 之 间 没 有 必然 的 关系 ,同一 模式 中 的 对 象 可 以 位 于 不 同 的 表 空间 ， 

表 空 间 也 可 包含 来 自 不 同 模式 的 对 象 。 


(3) 数据 块 、 区 和 段 

数据 块 是 Oracle 使 用 和 分 配 的 最 小 存储 单位 。 一 个 数据 块 对 应 物理 磁盘 空间 上 的 若干 字 节 。 
创建 数据 库 时 ， 为 每 个 Oracle 数 据 库 设置 数据 块 的 大 小 。 这 个 数据 块 大 小 应 该 是 操作 系统 块 大 
小 (不 超过 最 大 的 系统 操作 限制 ) 的 整数 倍 ， 以 避免 多 余 的 VO 操作 。 

逻辑 数据 库 空间 的 上 一 层 称 为 区 (extent)。 区 是 为 了 存储 特定 类 型 的 信息 而 分 配 的 车 干 
连续 数据 块 。 区 的 上 一 层 称 为 段 (segment)。 段 是 为 某 一 逻辑 结构 分 配 的 一 组 区 。 例 如 ， 每 
个 表 的 数据 存储 于 自己 的 数据 段 中 ， 而 每 个 索引 的 数据 存储 在 它们 自己 的 索引 段 中 。 图 18-7 
显示 了 数据 块 、 区 和 段 之 间 的 关系 。 
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图 18-7 数据 块 、 区 和 段 之 间 的 关系 


当 一 个 段 的 已 有 区 存储 满 时 ，Oracle 会 动态 地 再 分 配 空间 。 因 为 区 是 按 需 要 进行 分 配 的 ， 
因此 一 个 段 的 区 在 磁盘 中 有 可 能 连续 ， 也 有 可 能 不 连续 。 

2. Oracle 的 物理 数据 库 结 构 

Oracle 中 主要 的 物理 数据 库 结构 就 是 数据 文件 (datafile)、 重 做 日 志文 件 (redo log file) 
和 控制 文件 (control file)。 

(1) 数据 文件 | 

每 个 Oracle 数 据 库 都 有 一 个 或 多 个 物理 数据 文件 。 逻 辑 数据 库 结构 (如 表 和 索引 ) 的 数据 
物理 上 存储 在 这 些 数 据 文件 中 。 一 个 或 多 个 数据 文件 构成 了 表 空间 。 最 简单 的 Oracle 数 据 库 有 
一 个 表 空间 和 一 个 数据 文件 。 比 较 复杂 的 数据 库 可 能 有 4 个 表 空间 ， 每 个 表 空间 由 两 个 数据 文 
件 组 成 ， 也 就 是 共有 8 个 数据 文件 。 数 据 文件 和 表 空间 的 结构 如 图 18-6 所 示 。 

(2) 重 做 日 志文 件 

每 个 Oracle 数 据 库 都 有 两 个 或 多 个 重 做 日 志文 件 , 这 些 文件 记录 了 对 数据 进行 的 所 有 更 改 ， 
从 而 便于 恢复 数据 。 如 果 发 生 错 误 ， 则 修改 的 数据 没有 永和 久 地 写 入 数据 文件 ， 这 时 可 以 从 重 
做 日 志文 件 得 到 要 进行 的 修改 ， 从 而 防止 操作 丢失 。 

(3) 控制 文件 

每 个 Oracle 数 据 库 都 有 一 个 控制 文件 ， 该 文件 包含 指定 数据 库 物 理 结构 的 人 口 ， 例 如 : 

。 数 据 库 名 称 。 

“数据 库 的 数据 文件 和 重 做 日 志文 件 的 名 字 和 位 置 。 

。 数 据 库 创 建 的 时 间 惟 。 

3. PCTFREE 和 PCTUSED 

这 两 个 空间 段 参数 一 一 PCTFREE 和 PCTUSED，、 对 性 能 也 有 很 大 的 影响 。 当 创建 或 修改 表 
或 群集 (有 自己 的 数据 段 ) 时 ， 可 以 指定 这 些 参数 。 当 创建 或 修改 索引 (有 自 己 的 索引 段 ) 
时 ， 也 可 以 指定 存储 参数 PCTFREE。 这 两 个 参数 的 使 用 如 下 : 

“PCTFREE: 设置 数据 块 中 预 留 的 空白 空间 的 最 小 百分比 ， 此 空白 空间 是 用 于 更 新 已 在 

数据 块 中 的 记录 的 (默认 值 为 10)。 

* PCTUSED 在 新 记录 被 插入 块 中 之 前 ， 设置 用 于 记录 用 户 数据 以 及 所 有 Oracle 需 要 的 费 

用 的 块 空间 的 最 小 百分比 (默认 为 40)。 当 数据 块 中 存储 的 数据 达到 PCTFREE 所 限定 的 

界限 后 ，Oracle 认 为 该 数据 块 不 能 再 插入 新 的 记录 ， 直到 该 数据 块 存 有 数据 的 部 分 所 占 
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的 百分比 下 降 到 低 于 参数 PCTUSED 所 规定 的 百分比 ， 才 可 以 再 插入 新 的 记录 。 

PCTFREE 的 值 越 低 ， 为 更 新 现 有 记录 而 预 留 的 空间 就 越 少 ， 同时 也 就 允许 插入 更 多 新 的 
记录 。 这 样 ， 虽然 节省 了 空间 ， 但 却 增加 了 处 理 上 的 耗费 。 因为 ， 当 块 中 的 自由 空间 被 新 插 
入 的 或 更 新 后 的 记录 填 满 后 ， 就 要 重新 组 织 该 块 。 PCTUSED 的 值 越 低 ， 数 据 库 中 空白 的 空间 
就 越 大 ， 但 是 减少 了 插入 /更 新 操作 时 的 处 理 代价 。 

很 明显 ，PCTFREE 和 PCTUSED 的 和 不 能 超过 100。 如 果 它 们 的 和 小 于 100， 那 么 平衡 空 
间 和 IO 使 用 的 最 佳 配置 是 这 两 个 参数 的 和 ， 它 不 同 于 被 记录 占用 的 百 分 百 空 间 百分比 。 例 如 ， 
如 果 块 的 大 小 是 2048 字 节 ， 其 中 有 100 个 字 节 作为 块 的 头 ， 记录 的 大 小 是 390 个 字 节 ， 则 记录 
的 大 小 是 可 用 块 大 小 的 20%。 那 么 ， 为 了 充分 利用 空间 ， PCTFREE 和 PCTUSED 的 和 最 好 为 
80%。 男 一 方面 ， 如 果 它 们 的 和 等 于 100， 则 Oracle 将 尽力 保持 PCTFREE 大 小 的 自 由 空间 ， 这 
将 会 导致 最 高 的 处 理 代价 。 PCTFREE 和 PCTUSED 的 组 合 使 用 如 图 18-8 所 示 。 


记录 可 以 一 直 被 插入 ， 使 用 块 中 预 留 的 
直到 块 中 空间 占有 了 80%， 空间 更 新 现存 记录 。 
因为 PCTFREE 说 明 块 中 直到 使 用 空间 小 于 
20% 的 空间 必须 留 下 以 更 40%， 任 何 新 记录 不 
新 已 经 存在 的 记录 能 被 插入 





图 18-8 PCTFREE 和 PCTUSED 的 组 合 使 用 ， 其 中 PCTFREE=20%、PCTUSED=40% 


以 上 关于 Oracle 的 逻辑 和 物理 数据 库 结构 的 描述 并 不 是 很 详细 然而 ， 对 它们 的 介绍 是 为 了 让 
你 对 目标 DBMS 方 面 的 知识 有 一 个 了 解 ， 这 些 知识 是 成 功 地 进行 物理 数据 库 的 某 些 方面 的 设计 所 
需要 的 。 我 们 同时 也 强调 了 不 同系 统 之 间 的 区 别 。 例 如 ， 一 边 看 这 一 步 ， 一 边 翻 回 到 第 13 章 步 驴 
42， 那 里 是 使 用 Microsoft Access 来 处 理 的 。 你 将 看 到 ， 在 那 一 步 中 ， 其 实 什么 也 没 做 一 Microsoft 
Access 97 中 的 文件 组 织 方式 是 固定 的 。 对 于 PC RDBMS 来 说 ， 这 是 很 正常 的 。 如 果 现 在 来 研究 其 
他 的 多 用 户 RDBMS， 如 Ingres 或 SQL Server， 你 会 发 现 这 些 系统 的 逻辑 和 物理 结构 又 有 不 同 。 


文件 组 织 方式 


Oracle 9i 支 持 聚 徐 和 非 聚焦 的 表 ， 选择 使 用 聚 簇 的 还 是 非 聚 灸 的 表 依赖 于 前 面 对 事 务 的 分 
析 ， 但 这 个 选择 会 对 性 能 有 影响 。 在 考虑 合适 的 聚 簇 之 前 ， 忽略 掉 一 些小 表 是 个 很 好 的 办 法 ， 
因为 小 表 通 常 可 以 全 部 调和 内存 进行 处 理 。 从 图 18-5 中 ， 我 们 可 以 看 到 Perfect Pets 数 据 库 
中 的 小 表 是 Clinic、 Staff、Pen、Treatment、 Item 和 Pharmacy ， 因此 我 们 不 对 这 些 表 进行 进 
一 步 考虑 。 如 果 我 们 现在 考虑 剩 下 的 表 ， 可 以 产生 17.1.2 节 列 出 的 查询 事务 与 基本 表 之 间 的 
相互 作用 的 总 结 ， 如 表 18-2 所 示 。 基于 附录 D.7 给 出 的 指南 ， 我 们 决定 为 PetOwner 表 和 Pet 表 
创建 一 个 基 于 连接 列 ownerNo 的 聚 徐 索 引 。 


18.6 步骤 4.3: 选择 索引 
Oracle 自 动 为 每 个 主键 添加 索引 。 另 外 ， Oracle 推 荐 不 要 显 式 地 在 表 上 定义 UNIQUE 索 引 ， 
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而 是 在 需要 的 列 上 定义 UNIQUE 完 整 性 约束 。Oracle 是 通过 在 唯一 键 上 自动 定义 唯一 性 索引 来 
保证 UNIQUE 完 整 性 约束 的 。 这 个 推荐 的 例外 通常 与 性 能 有 关 。 例 如 ， 用 了 UNIQUE 约 束 的 
CREATE TABLE... AS SELECT 要 比 创建 表 时 没有 约束 ， 然 后 手工 创建 UNIQUE 索 引 慢 。 

让 我 们 假定 使 用 标识 的 主键 、 备 用 键 以 及 指定 的 外 键 来 创建 表 。 现 在 我 们 必须 要 做 的 是 
确定 是 否 需 要 任何 附加 的 索引 。 在 第 13 章 ， 我 们 建议 创建 一 个 愿望 列表 (wish-list) ， 然 后 在 
愿望 列表 中 考虑 每 个 福 在 的 索引 ， 以 确定 查询 性 能 的 提高 是 否 超过 了 更 新 发 生 时 性 能 的 下 降 。 
在 建立 愿望 列表 之 前 ， 忽 略 掉 一 些小 表 (Clinic、Staff、Pen、Treatment、Item 和 Pharmacy ) 
是 个 很 好 的 办 法 ， 因 为 小 表 通 常 可 以 全 部 调 入 内 存 进行 处 理 ， 而 不 需要 额外 的 索引 。 现 在 我 
们 考虑 剩 下 的 表 和 它们 的 相互 作用 ， 如 表 18-2 所 示 。 表 18-3 显 示 了 添加 索引 可 能 带 来 的 好 处 。 


注意 ”事务 2(eXdatepaid IS NULD) 使 用 的 查询 条 件 表 明 要 在 datePaid 列 上 创建 索引 。 但 是 ， 当 
查询 条 件 包含 IS NULL 或 IS NOT NULL 条 件 时 ，Oracle 并 不 使 用 索引 。 还 有 ， 由 于 事务 20) 每 
天 只 运行 一 次 ， 并 且 并 不 是 有 很 多 宠物 类 型 ， 所 以 Pen 表 中 的 petIype 列 上 的 索引 并 不 恰当 。 


表 18-2 ” 表 和 查询 事务 键 的 相互 作用 








表 事务 访问 频 度 (每 天 ) 
Appointment 2(1) join: Pet on petNo 250 
search condition: aDate 
Examination 2(c), 2(d) join: Pet on petNo 100 
2(d) join: Staff on staffNo 
Invoice 2(e), 2(f) join: PetOwner on ownerNo 10 
search condition: datePaid IS NULL 
2(n) join: PetOwner on ownerNo 1( 每 月 ) 
search condition: invoiceDate 
ltemClinicStock 2(q) search condition: InStock < reorderLeve 50( 每 月 ) 
Pet 2(b) join: PetOwner on ownerNo 1( 每 月 ) 
20) group: petType 1 


order by : petType 
aggregate: count on petType 


20) join: Clinic on clinicNo 250 
2(0) join: PetOwner on ownerNo 1500 
PharmClinicStock 2(p) search condition: inStock < reorderLevel 50( 每 月 ) 


表 18-3 Perfect Pets 数 据 库 的 其 他 索引 


表 索引 
一 一 一 
Pet clinicNo 
ownerNo 
Appointment aDate 
petNo 
Invoice . OwnerNo 


invoiceDate 


一 oeme 
18.7 步骤 5: 设计 用 户 视图 


Oracle 9i 支 持 SQL CREATE VIEW 语句 ， 所 以 为 每 个 用 户 创建 视图 是 很 容易 的 。 另 外 ， 使 
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用 Oracle Forms Builder(Oracle 窗 体 构造 器 ) 可 以 创建 基于 一 个 或 多 个 表 或 基于 视图 的 窗 体 。 
例如 ， 可 以 为 诊所 经 理 的 详细 信息 创建 一 个 视图 。 图 18-9a 说 明了 使 用 Schema Manager 创 建 一 
个 叫做 Clinic_Managers 的 视图 ， 而 图 18-9b 显 示 了 从 这 个 视图 构建 的 窗 体 。 


LECT s.sFNane, 3.sLiane, ol. t, Cc 
cl.state, cl.zipCode, cl.teliyo 


FPON Steff s, Clinic cl 
VMHERE 3.staffNo » cl.ngrStartfHo; 








a) 用 Oracle Enterprise Manager Console 创 建 视图 b) 从 这 个 视图 构建 的 表单 
图 18-9 创建 用 户 视图 


18.8 步骤 6: 设计 访问 规则 


作为 数据 库 分 析 阶 段 的 一 部 分 ， 需要 确定 用 户 的 类 型 ， 也 就 是 谁 将 使 用 系统 ， 以 及 为 完 
成 他 们 指定 的 任务 所 必须 赋 给 他 们 的 访问 级 别 。 正如 我 们 在 第 14 章 步骤 6 中 所 提 到 的 ， 数 据 库 
安全 性 通常 既 包 括 系 统 安全 又 包括 数据 安全 。 Oracle 使 用 的 一 种 系统 安全 形式 是 标准 的 用 户 名 
和 密码 机 制 ， 尽管 认证 用 户 的 职责 可 以 交 给 操作 系统 ， 但 在 这 种 形式 中 ， 在 获得 访问 数据 库 
的 权力 之 前 ， 用 户 必须 提供 合法 的 用 户 名 和 密码 。 图 18-10 说 明了 使 用 密码 认证 机 制 创建 一 个 
叫做 ADAMS 的 新 用 户 。 当 用 户 ADAMS 想 要 连接 数据 库 的 时 候 ， 将 会 弹出 一 个 类 似 图 18-11 的 
连接 (Connect) 或 登录 (Log On) 对 话 框 ， 用 户 填 人 用 户 名 和 密码 以 访问 指定 的 数据 库 。 

权限 

权限 是 执行 特定 类 型 的 SQL 语句 或 访问 其 他 用 户 的 对 象 的 权利 一 些 权限 的 例子 包括 : 

* 连接 到 数据 库 (创建 一 个 会 话 )。 

。 创 建 表 。 

“从 其 他 用 户 的 表 中 查询 行 。 

将 权限 授权 给 用 户 后 ， 这 些 用 户 就 可 以 完成 他 们 需要 的 任务 。 过 度 授权 会 降低 安全 性 ， 
因此 应 该 只 授权 给 绝对 需要 该 权限 完成 工作 的 用 户 。 在 Oracle 中 ， 有 两 种 不 同 的 权限 : 


默认 使 用 的 
表 空 间 





图 18-11 要 求 用 户 名 、 密 码 和 要 连接 的 数据 库 的 连接 对 话 框 


“系统 权限 

“对 象 权 限 

(1) 系统 权限 

系统 权限 就 是 执行 特定 的 动作 或 实现 在 特定 类 型 的 任何 模式 对 象 上 的 动作 的 权利 。 例 如 ， 
创建 表 空 间 和 在 数据 库 中 创建 数据 库 就 是 系统 权限 。 总 共有 80 多 个 系统 权限 。 要 授权 给 用 户 
和 角色 (角色 的 定义 稍 后 讨论 ) 或 从 用 户 和 角色 收回 系统 权限 ， 使 用 如 下 方法 之 一 : 

“ Oracle 安 全 管理 的 授权 系统 权限 /角色 对 话 框 和 收回 系统 权限 /角色 对 话 框 。 

"SQL GRANT 和 REVOKE 语 句 。 

但 只 有 用 ADMIN OPTION 被 授予 一 定 权 限 的 用 户 或 具有 GRANT ANY PRIVILEGE 系 统 
权限 的 用 户 才能 授予 或 撤销 系统 权限 。 

(2) 对 象 权 限 

对 象 权 限 是 在 具体 表 、 视 图 、 序 列 、 进 程 、 函 数 或 包 上 完成 特定 动作 的 权限 或 权利 。 不 
同 的 对 象 具有 不 同 的 对 象 权限 。 例 如 ， 从 Pen 表 中 删除 行 的 权限 就 是 对 象 权限 。 

一 些 模式 对 象 〈 例 如 ， 聚 和 化、 索引 和 触发 器 ) 并 没有 相关 的 对 象 权 限 ， 它 们 的 使 用 是 由 
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系统 权限 控制 的 。 例 如 ， 如 果 要 更 改 聚 徐 ， 那 么 用 户 必须 自 己 拥有 该 聚 徐 ， 或 者 拥有 ALTER 
ANY CLUSTER 系统 权限 。 

用 户 自动 拥有 包含 在 自己 模式 中 的 模式 对 象 的 所 有 对 象 权限 。 用 户 可 以 将 自己 拥有 的 任 
何 模式 对 象 的 任何 对 象 权限 授权 给 其 他 用 户 或 角色 。 如 果 授 权时 GRANT 语句 包含 WITH 
GRANT OPTION， 那 么 被 授权 者 以 后 也 可 以 将 该 对 象 权限 授权 给 其 他 用 户 ， 否则 被 授权 者 可 
以 使 用 该 权限 但 却 不 能 再 将 权限 授权 给 其 他 用 户 。 

表 和 视图 的 对 象 权限 如 表 18-4 所 示 。 

(3) 角色 

一 个 用 户 可 以 以 两 种 不 同 的 方式 获得 权限 。 

* 显 式 授权 给 用 户 。 例 如 ， 可 以 明确 地 将 向 Clinic 表 中 插入 记录 的 权限 授予 用 户 ADAMS、。 

例如 : 


GRANT INSERT ON clinic TO ADAMS ; 


表 18-4 每 种 对 象 权限 允许 权限 拥有 者 对 表 和 视图 所 做 的 操作 


对 象 /权限 表 视 图 
ALTER 用 ALTER TABLE 语 句 改变 表 定 义 N/A 


DELETE 用 DELETE 语 句 从 表 中 删除 行 。 注 意 : 授予 某 表 用 DELETE 语 句 从 视图 中 删除 行 
DELETE 权 限时 必须 同时 授予 该 表 的 SELECT 权限 

INDEX 用 CREATE INDEX 语 名 创建 表 的 索引 N/A 

INSERT 用 INSERT 语 句 为 表 插 入 新 行 用 INSERT 语 句 为 视图 插入 新 行 

REFERENCES 创建 引用 某 表 的 约束 。 不 能 将 该 权限 授予 角色 N/A 

SELECT 用 SELECT 语句 查询 表 用 SELECT 语句 查 询 视图 

UPDATE 用 UPDATE 更 改 表 中 的 数据 。 注 意 ， 授予 某 表 用 UPDATE 改 变 视图 中 的 数据 


UPDATE 权 限时 必须 同 时 授予 该 表 的 SELECT 权限 


表 名 该 类 型 对 象 可 


以 使 用 的 权限 






选择 的 权限 一 > 


图 18-12 为 角色 DEPUTYMANAGER 设 置 Clinic 表 的 Select、 Insert、 Update 和 Delete 权 限 
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。 也 可 以 将 权限 授予 一 个 角色 (一 个 命名 的 权限 组 ) ， 然 后 将 该 角色 授予 一 个 或 多 个 用 户 。 
例如 ， 将 对 Clinic 表 的 查询 、 插 入 、 更 新 和 删除 权限 授予 角色 DEPUTYMANAGER, 然 后 

”就 可 以 将 用 户 ADAMS 和 GLENN 添 加 到 角色 中 。 一 个 用 户 可 以 属于 几 个 角色 ， 几 名 用 户 
也 可 属于 同一 个 角色 。 图 18-12 说 明了 使 用 Oracle Security Manager (安全 管理 )， 将 权 
限 授予 角色 DEPUTYMANAGER 的 例子 。 


提示 因为 角色 可 以 更 简便 有 效 的 管理 权限 ， 所 以 应 该 尽量 把 权限 授予 角色 ， 而 不 是 某 
个 具体 的 用 户 。 


18.9 步骤 7: 考虑 引入 受 控 宛 余 


在 步骤 1.7 中 ， 关 系 Clinic Schedules Appointment 被 认为 是 宛 余 的 ， 但 这 会 引起 潜在 的 性 
能 问题 。 例 如 ， 为 了 确定 在 某 个 诊所 可 获得 的 预约 时 间 ， 就 必须 要 访问 Pet 表 。 在 这 种 情况 下 ， 
恢复 Schedules 关 系 并 将 Clinic 表 的 主键 (clinicNo) 加 到 Appointment 表 中 作为 外 键 可 能 是 更 可 
取 的 。 

考虑 隐 式 地 反 规 范 化 

在 Appointment 表 中 拥有 附加 的 clinicNo 列 ， 可 能 对 在 这 个 列 上 创建 索引 以 提高 事务 2 (1) 
的 性 能 是 值得 的 。 

(4) 实现 

现在 ， 已 经 完成 了 基本 表 、 文 件 组 织 方式 、 索 引 、 视 图 和 安全 机 制 的 构建 与 制定 ， 可 以 
开始 操作 数据 库 了 。 但 是 ， 正 如 第 16 章 所 讨论 的 ， 这 并 不 是 数据 库 设 计 的 结束 一 一 为 保证 系 
统 运行 正常 ， 不 断 地 监视 与 调整 操作 系统 是 很 重要 的 活动 ， 这 可 以 获得 系统 的 持久 的 成 功 。 
另外 ， 一 旦 系统 在 运行 ， 作 为 用 户 反 馈 和 更 改 需求 的 结果 ， 有 些 更 改 是 需要 的 。 有 时， 这 些 
变化 只 不 过 是 表面 的 ， 只 是 要 求 改变 用 户 界面 ， 而 不 影响 数据 库 本 身 。 但 有 时 ， 也 需要 修改 
数据 库 的 结构 。 这 时 ， 就 必须 重新 进行 一 些 逻 辑 和 物理 设计 中 的 步 观 ， 以 确保 正确 地 设计 和 
实现 这 些 更 改 。 
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本 章 主题 : 

。 高 级 数据 库 应 用 的 需求 。 

* 为 什么 关系 DBMS 目 前 不 能 很 好 地 支持 高 级 数据 库 应 用 。 

"分布 式 DBMS (DDBMS) 的 主要 概念 ， 

。 与 数据 库 复 制 有 关 的 主要 概念 。 

* 面向 对 象 的 DBMS (OODBMS ) 和 对 象 关 系 DBMS (ORDBMS ) 的 主要 概念 。 

。 数 据 仓 库 的 主要 概念 。 

“ 联机 分 析 处 理 (OLAP) 和 数据 挖掘 的 主要 概念 。 

* 将 数据 库 集成 到 网 络 环境 中 的 方法 。 

为 了 使 本 书 更 完整 ， 我 们 编写 了 本 章 来 讨论 数据 库 系统 的 现状 和 未 来 的 趋势 。 我 们 讨 
论 的 很 多 主题 本 身 就 是 一 个 重要 的 研究 领域 ， 我 们 仅仅 提供 了 它们 的 一 个 简要 说 明 。 如 果 
读者 对 这 些 领 域 感 兴趣 ， 建 议 参考 2002 年 Connolly 和 Begg 合 作出 版 的 书 。 本 章 将 涉及 到 以 
下 内 容 : 

。 高 级 数据 库 应 用 。 

。 目 前 的 关系 DBMS 的 缺陷 。 

* 分 布 式 DBMS 和 复制 服务 器 。 

。 面 向 对 象 的 DBMS 和 对 象 关系 DBMS 。 

。 数 据 仓 库 。 

"。OLAP 和 数据 挖掘 。 

"网 络 数据 库 集成 和 XML 。 


19.1 高 级 数据 库 应 用 


… 在 过 去 的 十 年 里 ， 计 算 机 行业 发 生 了 翻天 覆 地 的 变化 。 在 数据 库 系 统 方面 ， 关 系 DBMS 

已 经 在 传统 的 商业 应 用 中 得 到 了 广泛 的 应 用 ， 这 些 应 用 包括 订单 处 理 、 库 存 控制 、 银 行业 和 
航空 机 票 预订 等 。 但 是 ， 对 于 那些 应 用 需求 与 传统 商业 数据 库 应 用 有 很 大 不 同 的 应 用 领域 ， 
现 有 的 RDBMS 的 功能 是 不 够 的 。 这 些 应 用 包括 : 

。 计算 机 辅助 设计 。 

。 计算机 辅助 制造 。 

“办 公 室 信息 系统 和 多 媒体 系统 。 

。 地 理 信息 系统 。 

* 交互 式 、 动 态 的 Web 站 点 。 
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1. 计算 机 辅助 设计 (CAD ) 

CAD 数 据 库存 储 了 与 诸如 建筑 、 航 空 、 集 成 电路 芯片 这 样 的 机 械 电 气 设 计数 据 。 这 类 设 
计 有 一 些 共 同 特征 : 

。 设 计数 据 总 是 被 分 为 很 多 类 ， 每 类 有 少量 的 实例 。 传 统 的 数据 库 与 之 正好 相反 。 例 如 ， 

StayHome 数 据 库 仅仅 由 几 十 个 表 组 成 ， 尽 管 VideoForRent、Member、RentalAgreement 

这 样 的 表 中 包含 了 几 千 条 数据 。 

。 设 计 工 作 量 非常 大 ， 可 能 有 几 百 万 个 部 分 组 成 ,常常 要 设计 多 个 独立 的 子 系统 。 

。 设 计 不 是 静态 的 ， 而 是 随 着 时 间 推 移 而 发 展 的 。 当 设计 发 生 改 变 时 ， 与 它 有 关 的 内 容 也 

将 随 之 改变 。 设 计 的 动态 性 意味 着 在 一 开始 无 法 预见 到 某 些 操作 。 

。 由 于 拓扑 或 是 功能 的 关联 、 容 错 性 等 原因 ， 更 新 操作 的 影响 范围 较 大 。 一 个 更 改 很 可 能 

影响 大 量 设 计 对 象 。 

。 很 多 设计 方案 常常 是 为 了 设计 出 一 个 组 件 ， 而 且 必 须 为 每 个 部 分 维护 正确 的 版 本 ， 这 涉 

及 到 一 些 版 本 控制 和 配置 管理 。 

* 参 与 设计 的 员工 可 能 会 有 几 百 人 , 而 且 他 们 可 能 在 一 个 大 型 设计 的 多 个 版 本 中 并 行 工作 。 

尽管 如 此 ，、 最 终 的 产品 必须 是 一 致 的 、 协 调 的 。 这 有 时 候 被 称 为 “协作 工程 ”。 

2. 计算 机 辅助 制造 (CAM ) 

CAM 数 据 库存 储 了 和 CAD 系 统 相 似 的 数据 ， 只 是 增加 了 有 关 离散 产品 〈 如 在 生产 线 上 的 
汽车 ) 和 连续 产品 (如 化 学 合成 ) 的 数据 。 例 如 ， 在 化 学 制造 系统 中 ， 有 监视 系统 状态 信息 
的 应 用 程序 ， 如 反应 容器 的 温度 、 流 速 、 生 产 速度 等 。 还 包含 控制 各 种 物理 过 程 的 应 用 程序 ， 
如 开 闪 、 给 反应 堆 容器 提供 更 多 的 热量 、 提 高 冷却 系统 的 流速 等 。 这 些 应 用 程序 必须 能 够 实 
时 地 响应 ， 而 且 必 须 能 够 为 了 保持 优越 的 性 能 ， 以 很 小 的 代价 调整 过 程 。 在 这 个 例子 中 ， 系 
统 需 要 维护 好 具有 一 定 层次 结构 的 大 量 数据 ， 并 处 理 好 数据 之 间 复 杂 的 关系 。 它 也 必须 能 够 
快速 操纵 数据 以 进行 浏览 或 对 更 改 做 出 响应 。 

3. 办 公信 息 系统 (OIS) 和 多 媒体 系统 

OIS 系 统 存储 了 在 业务 中 涉及 到 计算 机 信息 控制 的 所 有 数据 ， 包 括 电子 邮件 、 文 档 、 货 物 
清单 等 等 。 为 了 更 好 地 支持 这 个 领域 ， 除 了 名 字 、 地 址 、 日 期 和 货币 信息 外 ， 我 们 需要 处 理 
更 多 种 类 型 的 信息 。 现 代 系 统 可 以 处 理 自由 格式 的 文本 、 图 片 、 图 表 、 音 频 、 视 频 等 。 例 如 ， 
一 个 多 媒体 文档 可 能 包含 文本 、 图 片 、 动 画 、 电 子 数据 表 和 声音 解说 等 。 文 档 可 能 用 特定 的 
结构 来 安排 这 些 内 容 ， 用 一 种 标记 语言 来 描述 这 种 结构 ， 如 SGML (标准 通用 标记 语言 )、 
HTML ( 超 文 本 标记 语言 ) 或 XML (扩展 性 标记 语言 )， 就 像 我 们 在 19.8 中 将 要 详细 讨论 的 。 

文档 可 能 由 多 个 系统 用 户 共享 ， 比 如 通过 基于 Internet 技 术 的 电子 邮件 和 布告 栏 来 共享 。 。 
而 且 ， 这样 的 应 用 程序 需要 存储 的 数据 的 结构 比 由 数字 和 文本 字符 牛 组 成 的 记录 的 结构 更 复 
杂 。 而 且 ， 现 在 对 于 使 用 电子 设备 代替 手写 笔记 的 需求 也 越 来 越 多 。 尽 管 很 多 笔记 可 以 通过 
手写 分 析 技术 转换 成 ASCH 文 本 ， 但 是 大 多 数 这样 的 数据 还 不 能 做 到 这 一 点 。 除 了 单词 外 ， 手 
写 数 据 还 包括 草图 、 图 表 等 等 。 

4. 地 理 信息 系统 (GIS) 

GIS 数 据 库存 储 了 各 种 空间 和 时 间 信息 ， 如 土地 管理 和 地 下 水 开采 中 的 应 用 。 这 些 系统 中 


@ ”世界 上 最 大 的 数据 库 World Wide Web 是 一 个 关键 的 数据 库 系统 ， 受到 很 多 人 的 关注 ， 但 它 却 几乎 没有 应 用 
， 任何 数据 库 技术 。 这 部 分 内 容 将 在 19.8 节 Web 和 DBMS 的 集成 中 介绍 。 
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的 大 多 数 数据 由 调查 和 卫星 图 产生 ， 而 且 往 往 数 量 很 多 。 研 究 工作 可 能 涉及 到 一 些 鉴别 特征 
的 工作 ， 例 如 ， 使 用 先进 的 “模式 识别 ”技术 基于 形状 、 颜 色 或 是 纹理 来 鉴别 。 

例如 ，EOS (Earth Observing System， 地 球 观察 系统 ) 就 是 一 个 在 过 去 十 年 中 由 NASA 发 
射 的 用 来 收集 信息 的 卫星 群 ， 收 集 到 的 信息 将 为 研究 地 球 的 长 期 发 展 趋 势 的 科学 家 研究 地 球 
? 室 “， 和 洋 和 陆地 提供 依据 。 所 预测， 这 些 卫星 每 年 可 以 返回 的 数据 量 可 达 上 x10" 字 节 。 


这 些 数据 将 和 别 的 数据 合成 到 一 起 ， 存 储 在 EOSDIS (EOS Data and Information System ， 
EOS 数 据 和 信息 系统 ) 中 。EOSDIS 不 仅 为 科学 家 还 为 非 科学 家 提供 了 他 们 所 需 的 信息 。 例 如 ， 
学 生 可 以 访问 EOSDIS 来 查看 世界 天 气 图 的 模型 。 该 数据 库 的 巨大 容量 和 支持 成 千 上 万 用 户 提 
出 的 大 量 的 信息 要 求 ， 将 为 DBMS 带 来 很 多 挑战 。 

5. 交互 式 、 灵 活 多 变 的 Web 站 点 

设想 一 个 Web 站 点 拥有 在 线 的 目录 来 销售 衣服 ， 该 站 点 维护 早期 的 访问 者 的 偏好 ， 并 元 
许 访问 者 进行 以 下 操作 : 

“浏览 目录 中 的 所 有 物品 ， 选 择 一 件 ， 便 可 以 获得 实物 的 图 片 和 相关 信息 。 

* 选择 与 用 户 定义 的 条 件 集 合 相 匹 配 的 物品 。 

“ 根据 客户 指定 的 服装 细节 (如 颜色 、 尺 寸 、 造 型 )， 得 到 服装 的 3D 效 果 图 。 

“根据 给 定 的 物品 的 附加 细节 ， 选 择 一 段 画外音 说 明 。 

* 浏览 有 合适 折扣 的 账单 总 额 。 

* 通过 一 个 可 靠 的 在 线 事务 交易 完成 购买 。 

这 类 应 用 的 要 求 与 前 面 提 到 的 那些 高 级 应 用 相 比 没有 多 少 区 别 ， 它 们 需要 处 理 多 媒体 内 
容 (文本 、 音 频 、 图 像 、 视 频数 据 和 动画 )， 需 要 根据 用 户 的 喜好 、 选 择 来 交互 地 改进 显示 方 
式 ， 而 且 还 要 能 够 处 理 复杂 数据 ， 站 点 支持 的 3D 效 果 图 功能 给 系统 附加 了 复杂 性 ， 

就 像 我 们 将 在 19.8 节 中 谈 到 的 ，Web 现 在 提供 了 一 种 相对 新 的 数据 管理 模式 ，XML 这样 
的 语言 在 电子 商务 领域 得 到 了 广泛 应 用 。Forrester Research Group 预言 ， 到 2006 年 美国 的 B2B 
交易 客 在 欧洲 将 达到 $2.1 万 亿 ， 在 美国 将 达到 $7 万 亿 。 总 之 ， 到 2006 年 ， 全 球 公司 的 电子 商 
务 税收 总 额 将 达到 $12.8 万 亿 ， 将 达到 全 球 18% 的 销售 量 。 随 着 因特网 应 用 的 普及 及 其 有 关 技 
术 的 逐渐 成 熟 ， 我 们 将 看 到 网 络 站 点 和 B2B 交 易 将 处 理 越 来 越 多 复杂 的 彼此 相关 的 数据 。 


19.2 关系 DBMS 的 缺陷 


在 第 ? 章 ， 我 们 提 到 关系 数据 模型 拥有 强大 的 理论 基础 ， 基 于 一 阶 的 谓词 逻辑 该 理论 支 
竺 了 SQL 语言 的 发 展 ，SQL 现 在 已 经 成 为 定义 和 操纵 关系 数据 库 的 标准 语言 。 关 系数 据 模 
的 男 一 个 好 处 在 于 它 的 简单 性 、 适 合 联机 事务 处 理 (OLTP)、 支 持 数 据 独 立 性 。 但 是 ， 关 系 
数据 模型 特别 是 RDBMS 并 不 是 没有 缺点 的 。 在 这 一 闻 中 ， 我 们 将 简要 的 讨论 一 下 _ 些 常见 的 
不 足 。 

1. 对 “现实 世界 ”实体 的 表达 能 力 弱 

昌 范 化 通 常 导致 表 与 “现实 世界 ”中 的 实体 不 对 应 ， 它 将 “现实 世界 ”中 的 实体 分 虽 上 
二 汉 庆 洒 显 示 ， 以 物理 表示 法 来 反映 实体 结构 ， 这 样 效率 会 比较 差 ， 常 常 要 在 查询 处 理 中 进 
行 很 多 连接 操作 。 

2. 语义 过 载 . 

关系 模型 表达 数据 和 数据 闻 关 系 的 构造 只 有 一 种 一- 表 。 例 如 ， 为 了 表达 实体 A 和 B 之 间 
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的 多 对 多 (*:*) 关系 ， 我 们 需要 创建 三 张 表 ， 两 个 分 别 用 于 表达 实体 A 和 B， 第 三 张 表 用 于 表 
达 实 体 间 的 关系 。 它 没有 一 种 机 制 来 区 分 实体 和 关系 ， 也 无 法 区 分 在 实体 间 存 在 的 不 同 种 类 
的 关系 。 例 如 ， 一 个 1:# 关 系 可 能 是 Has、Supervises、Manages 等 等 。 如 果 可 以 进行 区 分 ， 也 
许 我 们 就 可 以 将 语义 构建 到 操作 中 。 所 以 ， 我 们 说 关系 模型 语义 过 载 了 。 

3. 不 能 很 好 的 支持 业务 规则 

在 2.3 节 中 ， 我 们 已 经 介绍 了 实体 和 参照 完整 性 的 概念 ， 在 2.2.1 中 我 们 也 介绍 了 域 的 概念 ， 
它 也 是 业务 规则 。 但 是 ， 很 多 商业 化 系统 不 能 完全 支持 这 些 规则 ， 所 以 需要 将 它们 内 置 到 应 
用 程序 中 。 这 样 当然 是 危险 的 ， 而 且 容 易 导 致 做 重复 的 工作 。 更 糟糕 的 是 ， 可 能 还 会 引起 不 
一 致 现象 。 而 且 ， 在 关系 模型 中 不 支持 其 他 类 型 的 业务 规则 ， 这 又 意味 着 它们 需要 被 构建 到 
DBMS 或 应 用 程序 中 。 

4. 有 限 的 操作 

关系 模型 只 有 一 些 固定 的 操作 集 ， 例 如 面向 集合 和 记录 的 操作 ， 操 作 是 在 SQL 规格 说 明 
中 提供 的 。 但 是 ，SQL 目 前 不 允许 指定 新 的 操作 。 因 此 ， 在 给 许多 “现实 世界 ”对 象 的 行为 
建 模 就 有 了 太 多 的 限制 。 例 如 ， 一 个 GIS 应 用 程序 典型 的 使 用 点 、 线 、 线 组 、 多 边 形 和 一 些 处 
理 距 离 、 交 又 点 和 包含 关系 的 操作 。 

5. 处 理 递 归 查 询 困难 

数据 的 原子 性 意味 着 在 关系 模型 中 不 允许 出 现 重复 的 数据 组 ， 这 样 就 导致 了 处 理 递归 查 
询 极为 困难 。 递 归 查 询 就 是 那些 有 关 表 和 自身 直接 或 间接 的 关系 的 查询 。 为 了 解决 这 个 问题 ， 
SQL 可 以 嵌入 在 一 个 高 级 程序 设计 语言 中 ， 由 高 级 程序 设计 语言 来 提供 支持 反复 操作 的 功能 。 
而 且 ， 很 多 RDBMS 提 供 了 具有 类 似 结构 的 报表 书写 程序 。 不 管 是 哪 种 情况 ， 都 是 应 用 程序 而 
不 是 系统 的 内 在 功能 提供 了 所 需要 的 功能 。 

6. 阻抗 失 配 

在 3.1.1 节 中 ， 我 们 注意 到 ， 直 到 最 新 版 本 的 SQL 标准 ， 都 缺少 完全 的 计算 功能 。 为 了 解 
决 这 个 问题 并 且 提 供 更 多 的 灵活 性 ，SQL 标 准 提供 嵌入 式 SQL 来 帮助 开发 更 加 复杂 的 数据 库 
应 用 程序 。 但 是 ， 这 引起 了 阻抗 不 匹配 (impedance mismatch) 的 问题 ， 因 为 我 们 将 两 种 不 同 
的 程序 设计 模式 混合 在 了 一 起 。 

1) SQL 是 一 种 处 理 行 数据 的 声明 性 语言 ,而 诸如 C 语 言 这 样 的 高 级 语言 则 是 过 程 化 的 语言 ， 
一 次 只 能 处 理 一 行 数据 。 

2) SQL 和 3GL 使 用 不 同 的 模型 来 表达 数据 。 例 如 ，SQL 提 供 内 置 的 数据 类 型 Date (日 期 型 ) 
和 Interval (时 间 间 隔 型 )， 而 在 传统 的 编程 语言 中 却 没 有 这 样 的 类 型 。 因 此 ， 就 需要 应 用 程序 在 
两 种 表示 法 之 间 进 行 转 换 。 而 这 样 做 无 论 从 程序 设计 的 工作 量 还 是 运行 时 资源 的 使 用 来 看 都 是 低 
效 的 。 而 且 ， 由 于 我 们 使 用 两 种 不 同 的 系统 ， 因 此 ， 不 可 能 将 类 型 检测 作为 一 个 整体 自动 进行 。 

最 新 颁布 的 SQL 标准 一 -SQL3， 通 过 引入 很 多 新 的 特征 弥补 了 上 述 的 一 些 不 足 ， 例 如 作 
为 数据 定义 语言 一 部 分 的 定义 新 的 数据 类 型 和 操作 的 能 力 以 及 增加 一 些 新 的 结构 以 使 语言 具 
备 计算 完整 性 。 . 


19.3 分 布 式 DBMS 和 复制 服务 器 


开发 一 个 数据 库 系 统 的 主要 动机 是 ， 集 成 一 个 企业 的 操作 型 数据 并 提供 对 数据 的 访问 控制 。 
尽管 我 们 可 能 认为 集成 和 访问 控制 意味 着 集中 化 ， 但 这 并 不 是 目的 。 事 实 上 ， 计 算 机 网 络 的 发 展 
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促进 了 非 集中 式 的 工作 模式 。 这 种 非 集中 式 方法 镜像 很 多 公司 的 组 织 架 构 ， 它 们 被 逻辑 地 分 成 分 
公司 、 部 门 、 项 等 等 ， 并 且 在 物理 上 划分 成 办 公 室 、 分 支 机 构 、 工 厂 ， 每 个 单元 维护 自己 的 操作 
型 数据 。 分 布 式 DBMS 的 发 展 反 映 了 这 种 组 织 结构 ， 使 得 任何 一 个 单元 中 的 数据 都 可 访问 ， 并 且 
将 最 经 常 使 用 的 数据 存储 在 与 本 地 最 近 的 地 方 ， 这 改进 了 共享 数据 的 能 力 和 访问 数据 的 效率 。 





分 布 式 数据 库 (Distributed Database) ”一 个 远 辑 上 相关 的 共享 数据 (以 及 数据 的 描 
述 ) 的 集合 ， 它 们 物理 上 分 布 在 一 个 计算 机 网 络 上 。 









分 布 式 DBMS (Distributed DBMS) 克 许 管理 分 布 式 数据 库 并 且 使 得 这 种 分 布 对 用 户 


来 说 是 透明 的 软件 系统 。 





一 个 分 布 式 数据 库 管理 系统 (DDBMS ) 由 一 个 被 分 成 多 个 片断 的 逻辑 数据 库 组 成 。 每 个 片 
断 在 一 个 独立 的 DBMS 的 控制 下 ， 存 储 在 一 个 或 多 个 计算 机 (副本 ) 上 ， 这 些 计 算 机 又 通过 一 
个 通信 网 络 连 接 在 一 起 。 每 个 站 点 都 能 够 自主 地 处 理 用 户 提出 的 访问 本 地 数据 的 要 求 ( 即 每 个 
站 点 都 有 一 定 的 本 地 自治 能 力 )， 也 能 够 处 理 那 些 存储 在 网 络 中 其 他 计算 机 上 的 数据 。 

用 户 通过 应 用 程序 访问 分 布 式 数据 库 。 应 用 程序 被 划分 为 不 需要 别 的 站 点 数据 的 程序 
(本 地 应 用 程序 ) 和 需要 其 他 站 点 数据 的 程序 (全 局 应 用 程序 )。 我 们 需要 一 个 至 少 有 一 个 全 
局 应 用 程序 的 DDBMS， 因 此 ， 一 个 DDBMS 拥 有 下 列 特征 : 

* 逻辑 上 相互 关联 的 共享 数据 的 集合 。 

* 数据 被 分 割 成 多 个 片断 (片断 可 以 是 水 平 片断 也 可 以 是 垂直 片断 ， 这 与 我 们 在 第 15 章 中 

谈 到 的 水 平分 区 和 垂直 分 区 类 似 )。 

。 片 断 可 以 被 复制 。 

“片断 /副本 分 布 在 不 同 的 站 点 上 。 

* 这些 站 点 通过 一 个 通信 网 络 连 接 在 一 起 。 

* 每 个 站 点 上 的 数据 都 由 一 个 DBMS 控 制 。 

“每 个 站 点 上 的 DBMS 能 够 自主 地 处 理 本 地 的 应 用 程序 。 

“每 个 DBMS 至 少 参与 一 个 全 局 应 用 程序 。 

为 系统 中 的 每 个 站 点 都 配置 自己 的 本 地 数据 库 是 没有 必要 的 ， 就 像 图 19-1 中 显示 的 
DDBMS 的 拓扑 所 示 。 

站 点 1 





站 点 3 
图 19-1 分 布 式 数据 库 管理 系统 
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从 DDBMS 的 定义 中 我 们 知道 ， 系 统 需要 使 “分 布 ” 的 特点 在 用 户 看 来 是 透明 的 (不 可 见 
的 )。 所 以 ,分布 式 数 据 库 被 分 割 成 多 个 片断 存储 在 不 同 的 计算 机 中 , 而且 片断 可 能 是 复制 的 ， 
这 些 事实 都 需要 对 用 户 隐 藏 。 透明 性 的 目标 是 使 得 分 布 式 系统 看 起 来 跟 集中 式 系统 一 样 。 有 
时 ， 这 被 称 为 分 布 式 DBMS 的 基本 原则 ， 该 需求 为 最 终 用 户 提供 了 重要 的 功能 ， 但 是 ， 这 产 
生 了 许多 需要 DDBMS 处 理 的 额外 的 问题 。 

分 布 式 处 理 

将 分 布 式 DBMS 和 分 布 式 处 理 进行 比较 是 很 重要 的 。 


一 个 能 够 通过 计算 机 网 络 来 访问 的 集中 式 数据 库 。 





分 布 式 处 理 (Distributed Processing ) 


DDBMS 的 定义 的 关键 点 是 系统 由 在 物理 上 分 布 于 网 络 中 的 很 多 站 点 的 数据 组 成 。 如 果 数 
据 是 集中 的 ， 尽 管 其 他 用 户 可 能 是 通过 网 络 来 访问 数据 ， 但 我 们 也 不 认为 它 是 DDBMS ， 而 只 
能 称 之 为 分 布 式 处 理 。 图 19-2 说 明了 分 布 式 处 理 的 拓扑 。 比 较 本 图 和 图 19-1， 图 19-2 在 站 点 2 
上 有 一 个 集中 数据 库 ， 而 图 19-1 显 示 多 个 站 点 都 有 各 自 的 数据 库 。 

站 点 1 








站 点 3 


图 19-2 分 布 式 处 理 


19.3.1 DDBMS 的 优 缺 点 


数据 和 程序 的 分 布 相 对 于 传统 的 集中 式 数据 库 系 统 来 说 ， 有 很 多 潜在 的 优点 。 但 是 ， 它 
也 有 很 多 缺点 。 在 本 节 中 ， 我 们 将 简要 讨论 一 下 DDBMS 的 优点 和 缺点 。 

1. 优点 

反映 了 企业 的 结构 很 多 企业 本 来 就 是 分 布 在 多 个 地 区 的 ， 所 以 ， 将 应 用 在 这 些 企 业 上 的 
数据 库 分 布 在 不 同 地 区 是 自然 而 然 的 事情 。 

提高 了 共享 能 力 和 本 地 自治 能 力 地 理 上 分 散 的 企业 可 以 由 数据 的 分 布 性 来 体现 ， 某 个 站 
点 的 用 户 可 以 访问 存储 在 别 的 站 点 上 的 数据 。 数据 可 以 放置 经 常 使 用 该 数据 的 用 户 的 附近 。 
这 样 ， 用 户 就 可 以 在 本 地 控制 数据 了 ， 而 且 ， 我 们 还 可 以 根据 数据 的 使 用 情况 来 相应 地 建立 
和 加 强 本 地 策略 。 

提高 了 可 用 性 ”在 集中 式 DBMS 中 ， 计算 机 的 故障 将 中 止 DBMS 的 操作 。 但 是 ，DDBMS 
中 一 个 站 点 的 故障 ， 或 者 是 一 些 通信 线路 的 故障 ， 只 会 使 得 有 些 站 点 不 能 被 访问 ， 但 不 会 使 
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整个 系统 不 可 操作 。 

提高 了 可 靠 性 由 于 数据 可 以 被 复制 ， 所 以 它 将 在 多 个 站 点 存在 。 一 个 结 点 或 是 一 条 通信 
线路 的 故障 不 一 定 使 该 数据 不 可 访问 。 

提高 了 性 能 ”由 于 数据 位 于 “最 需要 使 用 ”的 站 点 附近 ， 加 上 DDBMS 本 身 固有 的 并 行 性 ， 
所 以 它 比 远程 集中 式 数 据 库 更 容易 改进 数据 库 的 访问 速度 。 而 且 ， 由 于 每 个 站 点 都 只 处 理 整 
个 数据 库 的 一 部 分 数据 ， 可 能 就 没有 集中 式 DBMS 中 对 CPU 和 IO 服务 的 争 用 。 

经 济 众所周知 ， 建 立 一 个 由 多 个 小 计算 机 组 成 的 系统 比 建立 具有 相同 性 能 的 单一 的 大 计 
算 机 的 花费 要 少 。 让 分 公司 和 部 门 都 拥有 自己 单独 的 计算 机 是 很 经 济 的 。 所 以 ， 通过 在 网 络 
中 添加 工作 站 比 更 新 主机 系统 要 更 经 济 。 

模型 增长 ”在 一 个 分 布 式 环境 中 ， 处 理 扩展 更 加 简单 。 新 的 站 点 可 以 加 入 到 网 络 中 而 不 影 
响 其 他 站 点 的 数据 操作 。 这 个 灵活 性 使 得 企业 的 扩展 相对 容易 。 

2. 缺点 

复杂 性 ”一 个 DDBMS 需 要 对 用 户 隐 藏 分 布 的 本 质 ， 而 且 还 需要 提供 了 用 户 满意 的 性 能 、 
可 靠 性 和 可 用 性 水 平 ， 这 使 得 DDBMS 比 集中 式 DBMS 更 复杂 。 复 制 也 增加 了 系统 的 复杂 性 ， 
因为 如 果 处 理 不 完全 ， 与 集中 式 系统 相 比 ， 将 导致 可 用 性 、 可 靠 性 和 性 能 降低 ， 那 么 我 们 前 
面 列举 的 一 系列 优点 也 将 变 成 缺点 。 

价格 ”提高 复杂 性 就 意味 着 获得 和 维护 DDBMS 的 代价 要 比 一 个 集中 式 DBMS 高 。 另 外 ， 
DDBMS 需 要 额外 的 硬件 来 建立 站 点 之 间 的 网 络 。 而 且 还 有 使 用 网 络 而 产生 的 通信 费用 。 另外 ， 
还 有 为 了 管理 和 维护 各 个 本 地 DBMS 和 网 络 的 人 力 资源 消耗 。 

安全 性 ”在 集中 式 系统 中 ， 可 以 很 容易 控制 对 数据 的 访问 。 但 在 DDBMS 中 ， 不 仅 需 要 在 
多 个 站 点 控制 对 复制 数据 的 访问 ， 而 且 网 络 本 身 也 需要 保证 安全 性 。 在 过 去 ， 网 络 被 认为 是 
一 个 不 安全 的 通信 媒体 ， 尽 管 这 个 问题 现在 仍然 存在 ， 但 最 近 已 经 在 网 络 安全 性 方面 有 了 重 
大 的 改进 。 

完整 性 控制 更 加 困难 ”加强 完整 性 约束 通常 需要 访问 定义 了 约束 的 大 量 数据 ， 但 不 包括 实 
际 的 更 新 操作 本 身 在 内 。 在 一 个 DDBMS 中 ， 用 来 加 强 完整 性 约束 的 通信 和 处 理 代价 可 能 都 是 
被 禁止 的 。 | 

缺乏 标准 ”尽管 DDBMS 依 赖 于 有 效 的 通信 ， 但 是 我 们 到 现在 才 开 始 看 到 通信 标准 和 数据 
访问 协议 的 出 现 。 标 准 的 缺乏 严重 限制 了 DDBMS 的 潜力 。 而 且 也 没有 帮助 用 户 将 集中 式 
DBMS 转 换 成 分 布 式 DBMS 的 工具 和 技术 。 

缺乏 经 验 ”尽管 很 多 协议 和 问题 已 经 被 理解 了 ， 但 DDBMS 的 一 般 目 的 并 没有 得 到 广泛 认 
同 。 结 果 ， 我 们 没有 达到 像 集中 式 DBMS 一 样 的 经 验 水 平 。 展望 该 技术 的 未 来 ， 这 可 能 会 是 
最 严重 的 威胁 。 

数据 库 设 计 更 加 复杂 除了 需要 考虑 设计 集中 式 数 据 库 的 一 些 问题 外 ， 设计 分 布 式 数据 
库 还 需要 考虑 数据 的 分 段 、 将 分 段 数据 分 布 到 具体 的 站 点 以 及 数据 复制 问题 。 

到 目前 为 止 ， 前 面 我 们 提 到 的 DDBMS 的 一 般 用 途 没 有 被 广泛 接受 ， 尽管 很 多 协议 和 问题 
已 经 被 很 好 地 理解 。 但 是 ， 数 据 复制 (在 多 个 服务 器 上 存储 和 维护 数据 ) 似乎 是 更 好 的 解决 
方法 。 每 个 主要 的 数据 库 开 发 商都 拥有 相应 的 复制 解决 方案 ， 而 很 多 非 数 据 库 开发 商 也 有 复 
制 数据 的 一 些 方法 。 复 制服 务 器 就 是 一 种 方案 ， 是 一 种 潜在 的 更 为 简单 的 数据 分 布 方法 ， 我 
们 现在 就 对 其 进行 详细 讨论 。 
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19.3.2 复制 服务 器 


复制 (Replication) ”在 一 个 或 多 个 站 点 上 生成 或 产生 数据 的 多 个 副本 的 过 程 。 


复制 是 一 种 重要 的 机 制 ， 因 为 它 可 以 使 企业 中 的 用 户 在 任何 时 候 任何 地 点 访问 最 近 的 数 
据 。 复 制 提供 了 很 多 好 处 ， 包 括 当 集 中 式 资 源 超载 时 改进 系统 性 能 ， 增 加 可 靠 性 和 数据 可 用 
性 ， 支 持 可 移动 计算 和 数据 仓库 。 在 本 节 中 ， 我 们 将 讨论 几 种 有 关 数 据 复制 的 背景 知识 ， 包 
括 期 望 的 功能 和 数据 所 有 权 。 我 们 从 讨论 什么 时 候 更 新 复制 的 数据 开始 。 

1. 同步 复制 和 异步 复制 

DDBMS 中 的 更 新 复制 数据 的 协议 建立 在 一 旦 源 数据 被 更 新 则 复制 的 数据 也 被 立刻 更 新 
( 即 ， 作 为 封闭 事务 的 一 部 分 ) 的 基础 上 。 这 种 复制 方案 称 之 为 同步 复制 。 这 种 机 制 适 合 那 种 
必须 保持 所 有 的 副本 都 同步 的 环境 下 (例如 ， 金 融 事务 )， 这 有 很 多 缺点 。 例 如 ， 如 果 一 个 或 
多 个 站 点 中 的 副本 不 可 用 ， 那 么 整个 事务 就 会 因此 无 法 完全 执行 成 功 。 进 一 步 说 ,同步 复制 
数据 需要 用 大 量 的 消息 来 进行 协调 ， 这 将 给 网 络 增加 巨大 的 负担 。 

很 多 商业 性 DBMS 提 供 了 一 种 同步 复制 的 替代 机 制 ， 称 为 异步 复制 。 使 用 这 种 机 制 ， 目 
标 数 据 库 将 在 源 数据 库 已 经 完成 修改 后 再 进行 更 新 。 重 新 获得 一 致 性 的 延 时 从 几 秒 到 几 个 小 
时 甚至 几 天 不 等 。 但 是 ， 数 据 最 终 将 在 所 有 复制 站 点 达到 一 致 。 尽 管 这 违背 了 分 布 式 数据 独 
立 性 的 原则 ， 但 它 被 认为 是 数据 完整 性 和 可 用 性 之 间 的 一 个 实用 的 折 中 ， 这 可 能 更 适合 那些 
需要 复制 但 是 不 一 定 要 求 同 步 或 并 发 的 企业 。 

2. 功能 

作为 最 基本 的 标准 ， 我 们 希望 一 个 分 布 式 数据 复制 服务 能 够 将 数据 从 一 个 数据 库 拷 贝 到 
另 一 个 数据 库 中 ， 同 步 复制 或 者 异步 复制 都 行 。 但 我 们 还 需要 其 他 的 功能 ， 例 如 : 

“复制 机 制 的 规格 说 了 明 ”系统 应 该 提供 一 种 允许 授权 的 用 户 指定 要 复制 的 数据 和 对 象 的 机 

制 。 

“* 订阅 机 制 系统 应 该 提供 一 种 允许 授权 的 用 户 订阅 复制 的 数据 和 对 象 的 机 制 。 

。 初 始 化 机 制 ”系统 应 该 提供 一 种 允许 初始 化 目的 副本 的 机 制 。 

。 伸缩 性 该 服务 应 该 能 够 处 理 小 数据 量 和 大 数据 量 的 复制 。 

* 贞 射 和 转换 ”该 服务 应 该 能 够 处 理 来 自 不 同 DBMS 和 平台 的 复制 。 这 可 能 涉及 到 把 数据 

从 一 种 数据 模型 映射 或 转换 到 另 一 种 数据 模型 ， 或 者 是 将 一 种 数据 类 型 的 数据 转换 为 另 

一 个 DBMS 中 的 相应 的 数据 类 型 。 

“对象 复 制 。 它 应 该 能 够 复制 除数 据 之 外 的 其 他 对 象 ， 例 如 ， 有 些 系统 允许 复制 索引 和 存 

储 过 程 (或 是 触发 器 ) 。 

“易于 管理 它 应 该 能 够 让 DBA 易 于 管理 系统 、 检 查 状态 以 及 监控 复制 系统 组 成 部 分 的 性 能 。 

3. 数据 所 有 权 

所 有 权 就 是 指 哪 个 站 点 拥有 更 新 数据 的 权限 。 主 要 的 所 有 权 种 类 有 主 / 从 、 工 作 流 和 任意 
更 新 权 (有 了 时 称 之 为 对 等 或 是 对 称 复制 )。 

(1) 主 / 从 所 有 权 

利用 主 / 从 所 有 权 ， 蜡 步 复制 数据 将 被 一 个 站 点 拥有 ， 该 站 点 被 称 为 主 站 点 ， 而 且 只 能 由 
该 站 点 进行 更 新 。 用 “发 布 -订阅 ”来 比喻 ， 主 站 点 (发布 者 ) 使 数据 可 被 访问 。 其 他 的 站 点 
将 “订阅 ” 主 站 点 拥有 的 数据 ， 这 就 意味 着 它们 只 能 在 本 地 系统 中 接受 只 读 的 副本 。 潜 在 的 ， 











梨 19 章 数据 亩 的 现状 布 发 展 251 


每 个 站 点 都 可 以 成 为 无 重合 数据 集 的 主 站 点 。 但 是 ， 只 能 有 一 个 站 点 可 以 修改 特定 数据 集 的 
主 副 本 ， 因 此 站 点 之 间 不 会 发 生 更 新 冲突 。 

一 个 主 站 点 可 能 拥有 整 张 表 的 数据 ， 在 这 种 情况 下 ， 其 他 站 点 只 能 订阅 该 表 的 只 读 副本 。 
另外 ， 多 个 站 点 可 能 分 别 拥有 一 张 表 的 不 同 的 片断 ， 其 他 站 点 只 能 订阅 片断 的 只 读 副本 。 这 
种 复制 类 型 也 被 称 为 异步 复制 。 

(2) 工作 流 所 有 权 

和 主 / 从 所 有 权 一 样 ， 该 模型 也 避免 了 更 新 冲突 ， 同 时 提供 了 更 灵活 的 所 有 权 模 式 。 工 作 
流 所 有 权 人 允许 更 新 复制 数据 的 权限 从 一 个 站 点 传 到 另 一 个 站 点 。 但 是 ， 在 任何 时 刻 ， 只 能 有 
一 个 站 点 能 够 更 新 特定 的 数据 集合 。 工 作 流 所 有 权 的 一 个 典型 的 例子 是 一 个 订单 处 理 系统 ， 
订单 处 理 有 一 系列 的 步骤 ， 例 如 订单 输入 、 订 单 批准 、 发 货 、 运 输 等 等 。 在 一 个 集中 式 
DBMS 中 ， 这 类 应 用 程序 都 在 一 个 集成 的 数据 库 中 访问 和 更 新 数据 ， 即 每 个 应 用 程序 当 且 仅 
当前 一 个 步骤 已 经 完成 时 ， 才 按 顺 序 更 新 数据 。 

(3) 在 任何 地 方 更 新 数据 的 所 有 权 (对 称 复制 ) 

前 面 两 种 模型 有 一 个 共同 的 特性 : 在 任何 给 定 的 时 刻 ， 只 有 一 个 站 点 可 以 更 新 数据 ， 其 
他 的 站 点 只 有 对 该 副本 的 只 读 权 限 。 在 有 些 环境 中 ， 这 就 显得 太 局 限 了 。 这 种 在 任何 地 方 更 
新 的 模型 在 多 个 站 点 拥有 更 新 复制 数据 的 权力 ， 这 创建 了 一 个 对 等 环境 。 这 允许 本 地 站 点 能 
够 自主 的 处 理 ， 即 使 这 些 更 新 对 其 他 站 点 是 不 可 用 的 。 

共享 拥有 权 可 能 导致 冲突 情况 ， 而 且 复 制 架构 要 能 够 开发 一 种 发 现 冲 突 和 解决 冲突 的 方 
法 。 一 个 简单 的 在 单 表 中 发 现 冲突 的 机 制 是 ， 源 站 点 发 送 在 最 后 一 次 刷新 操作 之 后 ， 所 有 更 
新 了 的 记录 的 旧 值 和 新 值 (分别 标 记 为 前 像 、 后 像 )。 在 目标 站 点 ， 复 制服 务 器 可 以 在 已 经 更 
新 了 的 目标 数据 库 中 检查 每 个 值 。 但 是 ， 我 们 必须 要 考虑 其 他 类 型 的 冲突 的 监测 ， 例 如 违反 
了 两 个 表 之 间 的 参照 完整 性 。 目 前 已 经 有 很 多 机 制 来 解决 冲突 ， 但 最 常用 的 是 : 最 早 /最 晚 的 
时 间 发 、 站 点 优先 权 和 保持 手工 解决 方法 。 


19.4 面向 对 象 的 DBMS 和 对 象 -关系 DBMS 


在 19.2 节 中 , 我 们 回顾 了 关系 模型 相对 新 兴 的 高 级 数据 库 应 用 的 要 求 的 不 足 之 处 , 在 本 节 ， 
我 们 将 简要 介绍 试图 解决 这 些 已 经 认识 到 的 不 足 之 处 的 两 个 有 竞争 力 的 方法 。 这 两 种 方法 都 
基于 面向 对 象 的 概念 ， 解 决 了 软件 开发 中 的 传统 的 问题 。 


19.4.1 面向 对 象 的 DBMS 


一 种 方法 是 将 面向 对 象 概念 和 数据 库 系统 结合 起 来 , 即 面向 对 象 数据 库 管理 系统 (OODBMS )。 
OODPBMS 出 现在 工程 和 设计 领域 ， 并 且 已 经 成 为 金融 业 和 电信 业 应 用 中 受 欢迎 的 系统 。 有 关 面 
向 对 象 数据 模型 已 经 提出 了 很 多 种 不 同 的 定义 。 例 如 ，Kim (1991 年 ) 定义 了 面向 对 象 数据 模 
型 (OODM)、 面 向 对 象 数据 库 (DODB ) 和 面向 对 象 DBMS (OODBMS ) 如 下 : 


OODM 一 个 捕获 面向 对 象 编程 中 支持 的 对 象 的 语义 的 (逻辑 ) 数据 模型 。 . 
OODB 由 OODM 定 义 的 持久 的 、 共 享 的 对 象 集合 。 


OODBMS OODB 的 管理 者 。 
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这 些 定义 是 非常 不 具体 的 ,而 且 反 映 了 一 个 事实 ， 即 没有 一 个 面向 对 象 数据 模型 能 够 和 
关系 系统 的 基本 数据 模型 等 价 。 每 个 系统 提供 了 自身 的 基本 功能 的 描述 。 基 于 一 些 现在 的 商 
业 OODBMS ， 我 们 可 以 发 现 面向 对 象 数据 模型 概念 是 从 不 同 的 领域 中 提取 出 来 的 ， 如 图 19-3 


所 示 。 . 
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图 19-3 面向 对 象 数据 模型 的 起 源 


OODBMS 最 早 被 提出 来 的 一 个 缺点 是 它们 缺乏 形式 化 的 数据 模型 。 但 是 ， 在 过 去 的 十 年 
里 ， 几 家 重要 的 厂商 (包括 Sun Microsystems、eXcelon Corporation、 Objectivity Inc.、POET 
Software、Computer Associates 和 Versant Corporation ) 组 成 了 对 象 数据 管理 组 (OPMG ) 定 
义 了 OODBMS 标 准 。ODMG 已 经 提出 了 一 个 对 象 模型 用 来 指定 数据 库 对 象 语义 的 标准 模型 。 
这 个 模型 很 重要 ， 因 为 它 决定 了 能 被 OODBMS 理 解 并 执行 的 内 置 语 义 。ODMG 也 提供 了 对 象 
定义 语言 和 对 象 查询 语言 ， 它 们 形成 了 SQL 的 一 个 超 集 。 

1. OODBMS 的 优点 

OODBMS 的 很 多 优点 是 “面向 对 象 ”和 系统 相 结合 的 结果 ， 例 如 : 

* 丰富 了 建 模 功能 。 

。 扩 展 性 。 

。 消 除了 “阻抗 不 匹配 ”。 

“ 能 够 支持 高 级 数据 库 应 用 。 
另外 一 些 优点 则 是 利用 更 多 合适 的 协议 的 结果 ， 例 如 : 

。 支 持 模式 进化 。 

.支持 长 时 间 的 事务 。 
另外 还 要 提 到 的 两 个 优点 是 : 

"更 具 表 达 力 的 查询 语言 OODBMS 一 般 使 用 “导航 访问 ”从 一 个 对 象 移 到 下 一 个 对 象 ， 
这 和 SQL 的 关联 访问 不 同 ( 即 ， 查 询 语句 的 声明 是 基于 一 个 或 多 个 谓词 )。“ 导 航 访问 ” 
更 适合 于 处 理 部 分 爆发 数据 、 递 归 查 询 等 等 。 

。 提 高 了 性 能 有 很 多 基准 已 经 指出 OODBMSEERDBMS 提 供 了 更 显著 的 性 能 改善 。 例 如 ， 
在 1989 年 和 1990 年 ，O001 基 准 连续 研究 了 OODBMS GemStone、Ontos、 ObjectStore、 
Objectivity/DB、Versant 和 RDBMS INGERS 及 Sybase， 结 果 显 示 OODBMS 的 性 能 平均 比 
RDBMS 提 高 30%。 . 
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2. OODBMS 的 缺点 
OODBMS 也 有 一 些 缺 点 : 
*。 缺少 可 借鉴 的 经 验 。 

。 缺少 标 准 。 

。 和 RDBMS 的 竞争 。 

。 缺少 视 图 的 支持 。 

。 缺 少 安全 性 支持 。 


19.4.2 对 象 -关系 DBMS 


从 传统 的 关系 数据 模型 脱离 出 来 并 将 面向 对 象 概念 和 数据 库 系 统 集成 在 一 起 的 方法 ， 有 
时 也 被 称 为 是 革命 性 的 方法 。 与 此 相对 应 ， 对 象 -关系 DBMS (ORDBMS ) 更 是 一 个 将 面向 
对 象 概念 和 扩展 关系 模型 的 数据 库 系 统 集成 起 来 的 革命 性 的 方法 。 

直到 最 近 ，DBMS 的 选择 似 平 都 在 RDBMS 和 OODBMS 之 间 。 但 是 ， 很 多 RDBMS 产 品 的 
厂商 已 意识 到 OODBMS 的 威胁 和 承诺 。 他 们 承认 传统 的 RDBMS 不 能 适用 于 19.1 节 中 提 到 的 高 
级 应 用 ， 而 且 需 要 附加 的 功能 。 但 是 ， 他 们 否认 扩展 的 RDBMS 不 能 提供 有 效 的 功能 或 者 处 理 
速度 太 慢 而 不 能 解决 新 的 复杂 性 问题 。 

如 果 我 们 注意 观察 出 现 的 高 级 数据 库 应 用 ， 我 们 会 发 现 它们 使 用 了 很 多 面向 对 象 的 特征 ， 
例如 用 户 扩 展 类 型 系统 、 封 装 性 、 继 承 性 、 多 态 性 、 方法 的 动态 绑 定 ， 包 括 非 第 一 范式 对 象 
的 复杂 对 象 以 及 对 象 标识 (如 图 19-3 所 示 )。 弥补 关系 模型 的 缺点 的 最 明显 的 方法 是 扩展 该 模 
型 使 其 具备 这 些 类 型 特征 。 尽管 每 个 RDBMS 实 现 了 不 同 的 特征 组 合 ， 但 这 个 方法 已 经 被 很 多 
扩展 型 RDBMS 所 采用 。 因 此 ， 现在 出 现 了 一 系列 的 这 种 模型 ， 每 个 模型 的 特点 都 依赖 于 它 朝 
-哪个 方向 以 何 种 程度 来 扩展 。 但 是 ， 所 有 的 模型 确实 都 共享 相同 的 基本 关系 表 和 查询 语言 ， 
都 合并 了 一 些 “ 对 象 ”的 概念 ， 而 且 有 些 模型 还 能 在 数据 库 中 像 存储 数据 一 样 存储 方法 (或 
者 是 存储 过 程 、 触 发 器 )。 . 

RDBMS 的 三 个 最 重要 的 厂商 -一 -Oracle、 Informix 和 IBM 都 已 经 将 它们 的 系统 扩展 成 为 了 
ORDBMS ， 尽 管 每 家 提供 的 功能 有 些 细微 的 差别 。 ORDBMS 的 概念 (作为 RDBMS 和 
OODBMS 的 混合 ) 保留 了 从 RDBMS 那 里 得 到 的 知识 和 经 验 的 财富 。 尽管 这 样 ， 有 些 专家 预 
测 ORDBMS 将 比 EDBMS 多 占 50% 的 市 场 份 额 。 

也 许 已 经 设想 到 ， 这 个 领域 的 操作 标准 是 基于 对 SQL 标准 的 扩展 。 国际 化 标准 组 织 早 在 
1991 年 就 已 经 开始 研究 SQL 的 对 象 扩展 问题 了 ， 该 扩展 成 为 了 SQL 1999 标 准 (通常 被 称 为 
SQL3 ) 的 一 部 分 。 SQL3 标 准 是 对 关系 模型 和 查询 语言 的 扩展 标准 的 一 种 尝试 ， 

1. ORDBMS 的 优点 

除了 弥补 在 19.2 节 中 提 到 的 很 多 弱点 外 ， 关系 数据 模型 的 扩展 的 主要 优点 来 自 于 它 的 重用 
性 和 共享 性 。 重用 性 源 于 扩展 DBMS 服 务 器 以 实现 标准 功能 ， 而 不 必 在 每 个 应 用 程序 中 都 纺 
程 。 例 如 ， 应 用 程序 可 能 需要 空间 数据 类 型 来 表示 点 、 线 和 多 边 形 ， 并 有 计算 两 点 间距 离 、 
点 到 线 距 离 、 点 是 否 包 含 在 多 边 形 内 、 两 个 多 边 形 是 否 有 重 又 等 其 他 一 些 内 容 的 相关 功能 集 
合 。 如 果 我 们 能 够 将 该 功能 植 和 人 服务 器 中 ， 那么 就 不 必 在 每 个 需要 用 到 这 些 功能 的 应 用 程序 
中 都 定义 它们 ， 而 是 允许 该 功能 集 被 所 有 应 用 程序 共享 使 用 。 这 些 优点 不 仅 提高 了 开发 者 的 
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效率 ， 也 提高 了 最 终 用 户 的 效率 。 

另外 一 个 显著 的 优点 是 扩展 关系 方法 保留 了 开发 关系 型 应 用 程序 的 一 些 重 要 的 知识 和 经 
验 。 这 是 很 重要 的 一 个 优点 ， 因 为 很 多 组 织 都 发 现 进行 改变 并 不 是 很 贵 。 如 果 设 计 了 新 的 功 
能 ， 该 方法 能 够 允许 企业 在 不 失去 现 有 数据 库 特征 和 功能 的 优点 的 情况 下 ， 以 革命 性 的 方式 
利用 新 的 扩展 。 所 以 ，ORDBMS 可 以 作为 一 个 综合 的 方法 、 一 个 概念 实验 项 目 来 介绍 。 最 近 
的 SQL3 标 准 是 与 SQL2 标 准 完 全 兼容 的 标准 ， 因 此 任何 遵从 SQL3 的 ORDBMS 都 能 够 提供 这 些 
兼容 性 。 

2. ORDBMS 的 缺点 

ORDBMS 方 法 有 一 个 明显 的 缺点 ， 就 是 复杂 性 和 相关 费用 增加 ， 而 且 ， 有 些 关 系 型 方法 
的 支持 者 还 认为 这 种 扩展 失去 了 关系 模型 最 重要 的 简单 性 和 纯正 性 。 也 有 一 些 人 认为 RDBMS 
扩展 后 ， 只 能 适应 小 部 分 的 应 用 ， 而 不 能 成 功 得 到 目前 关系 型 技术 的 理想 性 能 。 

另外 ， 面 向 对 象 支持 者 也 没有 被 这 些 扩展 所 吸引 。 他 们 认为 ORDBMS 术 语 是 有 启迪 作用 
的 ，ORDBMS 不 讨论 对 象 模型 ， 而 是 使 用 像 用 户 定义 数据 类 型 之 类 的 术语 。 面 向 对 象 的 术语 
是 围绕 抽象 类 型 、 类 层次 结构 和 对 象 模型 等 。 但 是 ， 通 过 增加 一 些 复杂 性 ，ORDBMS 厂 商 正 
试图 描绘 对 象 模型 以 作为 关系 模型 的 扩展 。 这 潜在 地 避 开 了 面向 对 象 的 观点 ， 强 调 了 两 种 技 
术 之 间 语 义 上 的 重大 差别 。 对 象 应 用 不 是 简单 的 基于 关系 型 的 数据 中 心 。 面 向 对 象 模型 和 程 
序 将 关系 和 封装 的 对 象 更 紧密 地 结合 在 了 一 起 ， 更 贴近 地 反映 了 “现实 世界 ”*"。 事 实 上 ， 对 象 
本 质 上 不 是 数据 的 扩展 ， 而 是 一 个 对 “现实 世界 ”关系 和 行为 有 更 强 表达 能 力 的 完全 不 同 的 ， 
一 个 概念 。 1 


19.5 数据 仓库 


19 世 纪 70 年 代 以 来 ， 企 业 越 来 越 多 的 关注 他 们 在 能 够 自动 处 理 业务 的 新 的 计算 机 系统 上 
的 投资 〈 被 称 为 联机 事务 处 理 (OLTP) 系统 )。 通 过 这 种 方法 ， 企 业 能 够 通过 该 系统 获得 更 
大 的 竞争 力 ， 即 为 顾客 提供 更 有 效 更 经 济 的 服务 。 在 这 段 时 期 ， 企 业 在 他 们 的 数据 库 中 积累 
了 日 益 增 长 的 大 量 的 数据 。 但 是 ， 现 在 这 种 系统 如 此 普遍 ， 企 业 开始 关注 使 用 这 些 操作 数据 
来 做 出 决策 的 方法 ， 以 获得 更 强 的 竞争 力 。 

运作 的 系统 从 来 就 不 是 为 了 支持 商业 决策 而 设计 的 ， 所 以 使 用 这 样 的 系统 可 能 永远 也 不 
能 得 到 简单 的 解决 方案 。 问 题 是 一 个 企业 可 能 会 有 几 个 系统 同时 存在 ， 所 以 有 时 候 会 出 现 重 
复 和 冲突 的 定义 ， 例 如 数据 类 型 。 企 业 的 困难 是 如 何 将 数据 源 转换 为 知识 源 ， 从 而 为 用 户 提 
供 一 个 集成 /合成 的 企业 数据 视图 。 于 是 ， 数 据 仓库 的 概念 应 运 而 生 ， 它 满足 了 系统 的 要 求 ， 
能 够 支持 决策 制定 、 从 多 个 操作 型 数据 源 中 获得 数据 。 


数据 仓库 (Data Warehouse) 从 一 些 不 同 的 操作 型 数据 源 整 理 出 企业 数据 的 合成 的 /集成 
的 视图 ， 并 有 一 系列 最 终 用 可 使 用 的 工具 来 支持 从 简单 到 复杂 的 查询 以 制定 决策 的 工具 。 


在 数据 仓库 中 的 数据 是 面向 主题 的 、 集 成 的 、 随 时 间 变化 的 、 稳 定 的 ， 

“面向 主题 ”指数 据 仓库 是 围绕 企业 的 主要 的 主题 (比如 顾客 、 产 品 、 销 售 ) 而 不 是 根据 
主要 的 应 用 领域 (如 用 户 发 货 、 库 存 控制 和 产品 销售 ) 来 组 织 系统 的 。 这 反映 了 存储 支 
持 决 策 数据 的 需要 ， 而 不 是 存储 面向 应 用 的 数据 的 需要 。 

“ 集成 的 ”因为 源 数据 来 自 企业 范围 内 不 同 的 应 用 系统 ， 所 以 源 数据 常常 是 不 一 致 的 ， 例 
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如 ， 常常 使 用 不 同 的 数据 类 型 或 格式 。 集 成 后 的 数据 源 必须 一 致 以 便 给 用 户 提供 一 个 统 
一 的 数据 视图 。 

。 随 时 间 变 化 。 数据 仓库 中 的 数据 只 在 某 个 时 间 点 或 在 一 定 的 时 间 间 隔 中 才 是 准确 的 、 有 
效 的 。 数 据 仓库 随时 间 变化 的 特征 在 数据 运行 的 时 候 也 会 出 现 ， 在 所 有 数据 都 隐 式 或 显 
式 的 与 时 间 有 关 ， 事 实 上 数据 代表 了 一 系列 的 “快照 ”时 都 会 出 现 。 

。 稳 定 的 “” 数据 并 不 是 实时 更 新 的 ， 而 是 定期 从 操作 型 系统 中 刷新 。 新 数据 常常 作为 数据 
库 的 补充 增加 进来 ， 而 不 是 替代 原先 的 数据 。 数 据 库 不 停 的 吸收 新 的 数据 ， 并 逐渐 将 它 
和 原先 的 数据 集成 到 一 起 。 
数据 仓库 的 典型 架构 如 图 19-4 所 示 。 





操作 型 数据 源 1 
报表 、 查 询 、 应 


有 用 开发 和 EIS 工 具 
操作 型 数据 源 2 有 查询 管理 器 
OLAP 工 具 
操作 型 数据 源 n a | 
吕 
操作 型 数据 的 数据 挖掘 工具 
存储 (ODS) 终端 用 户 访问 


工具 
归档 /备份 数据 
图 19-4 典型 的 数据 仓库 架构 


数据 仓库 的 操作 型 数据 源 是 由 大 型 主机 、 私 有 的 文件 系统 、 私 有 的 工作 站 和 服务 器 以 及 
诸如 因特网 这 样 的 外 部 系统 提供 的 。 一 个 操作 型 数据 存储 (ODS) 是 用 于 分 析 的 当前 的 和 
集成 的 数据 的 仓库 ， 它 常常 和 数据 仓库 有 同样 的 组 织 方式 ,但 是 实际 上 仅仅 是 作为 把 数据 
移入 数据 仓库 的 集结 区 。 负 载 管 理 器 完成 所 有 与 数据 抽取 和 加 载 数据 到 数据 仓库 有 关 的 操 
作 。 数 据 仓库 管理 器 运行 所 有 和 数据 管理 有 关 的 操作 ， 例 如 源 数据 的 转移 和 合并 、 索 引 的 
创建 和 在 基本 表 上 建立 视图 、 产 生 聚 合 、 备 份 并 归档 数据 等 。 查 询 管 理 器 完成 所 有 与 管理 
用 户 查 询 有 关 的 操作 。 细 节 数 据 不 是 在 线 存储 的 数据 ， 而 是 要 经 过 综合 后 用 于 下 一 个 级 别 
的 数据 。 但 是 ， 细 节 数 据 定期 作为 综合 数据 的 补充 加 入 到 数据 仓库 之 中 。 数 据 仓库 存储 所 
有 由 数据 仓库 管理 器 事先 定义 的 轻 度 综合 和 高 度 综合 的 数据 。 综 合 信息 的 目的 是 为 了 加 快 
查询 速度 。 尽 管 初级 的 综合 数据 增加 了 操作 代价 ， 但 是 在 响应 用 户 查询 时 降低 了 执行 综合 
操作 (例如 排序 和 分 组 ) 的 需求 ， 从 而 使 代价 得 到 弥补 。 综 合 数据 在 新 数据 载 入 数据 仓库 
时 进行 更 新 ,为 了 归档 和 备份 的 目的 ， 细 节 数 据 和 综合 数据 都 被 脱 机 存储 。 元 数据 (关于 
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数据 的 数据 ) 的 定义 被 数据 仓库 中 的 所 有 处 理 使 用 ， 包 括 提取 和 加 载 处 理 、 数 据 仓库 的 管 
理 处 理 以 及 部 分 查询 管理 处 理 。 

数据 仓库 的 首要 目的 是 为 制定 决策 的 商业 用 户 提供 信息 。 这 些 用 户 通过 最 终 用 户 访问 工 
具 (end-user access tool) 来 和 数据 仓库 进行 交互 。 数 据 仓库 必须 有 效 地 支持 特殊 查询 、 日 党 
程序 分 析 以 及 更 复杂 的 数据 分 析 。 典 型 的 最 终 用 户 访问 工具 类 型 包括 报表 和 查询 工具 、 应 用 
程序 开发 工具 、 可 执行 信息 系统 (EIS) 工具 、 联 机 分 析 处 理 (OLAP) 工具 以 及 数据 挖掘 工 
有 具 。 我 们 将 在 下 面 章节 中 讨论 OLAP 和 数据 挖掘 工 具 。 


数据 集 市 
和 数据 仓库 同时 出 现 的 一 个 相关 的 概念 是 数据 集 市 。 
数据 集 市 (Data Mart) ”数据 仓库 的 一 个 子 集 ， 支 持 一 个 部 门 或 商业 领域 的 决策 制定 要 求 。 


数据 集 市 中 存 有 数据 仓库 中 的 部 分 数据 ， 常 常 是 以 和 特定 部 门 或 是 商业 领域 ( 如 市 场 营 
销 、 客 户 服务 ) 有 关 的 综合 数据 的 形式 存放 。 数 据 集 市 可 以 独立 存在 ， 也 可 以 和 企业 数据 仓 
库 相 连 。 当 数据 仓库 逐渐 增 大 时 ， 就 可 能 会 危及 到 为 企业 机 构 的 各 种 要 求 提 供 服 务 的 能 力 . 
数据 集 市 的 普及 取决 于 企业 数据 仓库 是 否 难以 创建 和 使 用 的 事实 。 

有 好 几 种 创建 数据 集 市 的 方法 ， 一 种 方法 是 先 构建 多 个 数据 集 市 ， 然 后 最 终 合 成 为 一 个 
数据 仓库 。 另 一 种 方法 是 ， 为 一 个 企业 数据 仓库 创建 一 个 基础 结构 ， 同 时 为 了 满足 企业 的 中 
间 需 求 创建 一 个 或 多 个 数据 集 市 。 

数据 集 市 体系 结构 可 以 创建 成 两 层 或 三 层 的 数据 库 应 用 程序 。 数 据 仓库 是 可 选 的 ， 属 于 
第 一 层 (如 果 数 据 仓库 为 数据 集 市 提供 数据 )， 数 据 集 市 是 第 二 层 ， 最 终 用 户 工作 站 是 第 三 层 ， 
数据 分 散在 三 层 之 中 。 创 建 数据 集 市 的 理由 包括 : 

。 为 用 户 提供 最 经 常 分 析 的 访问 数据 。 

* 提供 一 种 符合 要 求 的 数据 形式 ， 符 合 部 门 或 数据 领域 中 一 组 用 户 浏览 的 数据 集合 。 

“由 于 减少 了 被 访问 的 数据 量 ， 因 此 改进 了 最 终 用 户 的 响应 时 间 。 

“提供 了 由 诸如 联机 分 析 处 理 (OLAP) 和 数据 控 握 工具 等 最 终 用 户 访问 工具 使 用 的 合适 

的 结构 化 数据 ， 这 些 工具 可 能 要 求 它 们 有 自己 内 部 的 数据 库 结构 。 事 实 上 ， 为 了 支持 它 

们 特定 的 功能 ， 这 些 工具 常常 创建 它们 自己 的 数据 集 市 。 

“数据 集 市 常常 使 用 相对 较 少 的 数据 ， 所 以 数据 清理 、 数 据 加 载 、 数 据 转移 和 数据 集成 工作 都 

变 得 非常 容易 ， 因 此 实现 和 创建 一 个 数据 集 市 与 建立 一 个 企业 数据 仓库 比 起 来 要 简单 很 多 。 

。 实现 一 个 数据 集 市 的 成 本 常常 比 建立 一 个 数据 仓库 的 成 本 要 少 。 

“ 数据 集 市 的 潜在 用 户 能 够 更 清楚 地 被 定义 ， 并 且 与 企业 数据 仓库 项 目 比 起 来 ， 他 们 能 够 

更 容易 被 发 展 成 为 支持 数据 集 市 项 目的 目标 群 。 

支持 数据 仓库 和 数据 集 市 应 用 程序 的 数据 库 ， 与 支持 传统 的 OLTP 应 用 程序 的 数据 库 有 很 
大 不 同 。 读 者 如 果 对 如 何 设计 一 个 支持 决策 应 用 的 数据 库 感 兴趣 ， 可 以 参考 2002 年 Connolly 
和 Begg 出 版 的 书 。 


19.6 联机 分 析 处 理 
在 过 去 几 十 年 里 ， 我 们 已 经 看 到 RDBMS 广 泛 使 用 ， 并 且 受 欢迎 的 程度 越 来 越 高 ， 所 以 我 
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们 现在 发 现 企业 的 大 部 分 数据 都 存储 在 这 种 系统 中 的 。 关 系数 据 库 主要 用 于 支持 传统 的 OLTP 
系统 。 为 了 给 OLTP 系 统 提供 合适 的 支持 ，RDBMS 已 经 发 展 成 为 能 够 高 效 执行 相对 简单 的 事 
务 的 系统 。 

在 过 去 几 年 里 ，RDBMS 厂 商 将 目标 投向 了 数据 仓库 市 场 ， 并 已 经 改进 了 他 们 的 系统 作为 
创建 数据 仓库 的 工具 。 一 个 数据 仓库 存储 了 操作 型 数据 ， 并 能 够 支持 从 相对 简单 到 非常 复杂 
的 查询 。 但 是 ， 响 应 特定 查询 的 能 力 依赖 于 数据 仓库 中 能 够 使 用 的 最 终 用 户 访问 工具 的 种 类 。 
一 般 的 工具 (如 报表 和 查询 工具 ) 很 容易 支持 对 过 去 事件 的 “ 谁 ” 和 “什么 ”的 查询 。 一 个 
直接 由 数据 仓库 执行 的 典型 的 查询 是 : “Seattle 2003 年 第 三 季度 的 总 税收 有 多 少 ? ”但 是 ,使 
用 称 为 联机 分 析 处 理 (OLAP) 的 工具 来 访问 数据 仓库 ， 就 能 够 支持 更 高 级 的 查询 并 进行 数据 
分 析 。 





联机 分 析 处 理 (OLAP) “对 大 量 多 维 数据 集 进行 动态 综合 、 分 析 和 合并 。 


OLAP 描 述 了 一 种 技术 ， 这 种 技术 使 用 综合 数据 的 多 维 数据 视图 来 快速 访问 策略 信息 ， 以 
便 进行 高 级 分 析 。OLAP 使 得 用 户 能 够 通过 快速 、 一致 和 交互 的 方式 访问 大 量 可 能 的 数据 视图 ， 
对 企业 数据 有 更 深入 的 了 解 和 认识 。OLAP 人 允许 用 户 以 如 下 方式 使 用 企业 数据 : 它 是 企业 真正 
的 维度 模型 。 在 OLAP 能 够 轻而易举 地 回答 “ 谁 ” 和 “什么 ”这 样 的 问题 时 ， 它 们 还 能 回答 
“如 果 …… 怎 样 ……” 和 “为 什么 ”这 样 的 问题 ， 这 就 是 它们 和 一 般 目 的 的 查询 工具 的 不 同 。 
OLAP 能 够 支持 对 未 来 动作 做 出 决策 。 一 个 典型 的 OLAP 计 算 比 简单 地 综合 数据 更 复杂 ，、 例 如 ， 
“如 果 法 律 费用 上 涨 3.5%， 政 府 金 额 超过 $100000 的 财物 的 税收 下 降 1.5%， 对 美国 不 同 地 区 的 
销售 业 会 有 什么 影响 ? ”所 以 ，OLAP 可 以 进行 不 同 的 分 析 ， 从 基础 导航 到 浏览 ( 即 “切片 和 
切 块 " )、 计 算 以 及 更 复杂 的 分 析 (如 时 间 序 列 和 复杂 建 模 )。 

在 各 种 商业 领域 中 有 很 多 OLAP 的 应 用 例子 ， 如 表 19-1 所 示 。 

表 19-1 在 不 同 商业 领域 的 OLAP 应 用 实例 


商业 领域 OLAP 应 用 实例 

金融 业 预算 、 基 于 活动 的 成 本 、 金 融 性 能 分 析 、 财 务 模型 

销售 业 销售 分 析 和 销售 预测 

市 场 营销 市 场 研究 分 析 、 销 售 预 测 、 促 销 分 析 、 顾 客 分 析 、 市 场 /顾客 切 分 
制造 业 产品 计划 和 次 品 分 析 


所 有 OLAP 应 用 的 首要 要 求 是 为 用 户 提供 及 时 (Just-in-Time，JIT) 信息 的 能 力 ， 这 对 为 
企业 战略 方向 作出 有 效 的 决策 是 必需 的 。JIT 信 息 是 一 种 经 过 计算 的 数据 ， 常 常 反 映 了 复杂 的 
关系 ， 通 常 是 在 不 运行 的 时 候 计算 的 。 只 有 响应 时 间 一 直 很 短 ， 分 析 建 模 复杂 的 关系 才 有 实 
际 意义 。 另 外 ， 由 于 数据 关系 的 特性 不 能 预知 ， 所 以 数据 模型 必须 是 灵活 的 。 一 个 真正 灵活 
的 数据 模型 保证 OLAP 系 统 能 够 响应 为 了 有 效 地 出 决策 而 不 断 变化 的 业务 要 求 。 尽 管 OLAP 应 
几 的 商业 领域 有 很 大 不 同 ， 但 是 它们 都 需要 有 企业 数据 的 多 维 视图 、 支 持 复杂 的 计算 (如 预 
测 ) 和 时 间 智能 。 时 间 智能 是 任何 一 个 分 析 型 应 用 的 关键 特征 ， 因 为 性 能 常常 由 时 间 来 衡量 ， 
例如 ， 这 个 月 和 上 个 月 比较 ， 或 者 是 这 个 月 和 去 年 这 个 月 的 比较 。 

成 功 实现 OLAP 应 用 程序 的 好 处 有 : 

“ 对 战略 信息 的 访问 更 可 控 、 更 及 时 ， 可 以 作出 更 有 效 的 决策 。 
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。 通过 给 最 终 用户 更 多 的 自主 权 来 改变 数据 库 ， 建 立 他 们 自己 的 模型 ， 缩 短 了 IT 工作 人 员 
进行 应 用 程序 开发 所 做 的 工作 。 

。OLAP 应 用 程序 依赖 于 数据 仓库 和 OLTP 系 统 来 刷新 它们 的 数据 源 ， 所 以 保留 了 企业 数据 
的 完整 性 控制 。 

。 减 少 了 OLTP 系 统 和 数据 仓库 的 查询 量 和 网 络 流量 。 

。 使 企业 能 更 快 响应 市 场 需求 ， 减 少 了 潜在 的 风险 ， 提 高 了 收益 。 


19.7 ”数据 挖掘 


仅仅 将 信息 存储 在 数据 仓库 中 并 不 能 给 组 织 提供 所 需要 的 好 处 。 为 了 实现 数据 仓库 的 价 
值 ， 我 们 需要 将 数据 仓库 中 隐藏 的 知识 挖掘 出 来 。 但 是 ， 随 着 数据 仓库 中 数据 的 数量 和 复杂 
性 的 增长 ， 业 务 分 析 人 员 只 使 用 简单 查询 和 报表 工具 确定 趋势 和 数据 之 间 的 关系 变 得 越 来 越 
困难 了 。 数 据 挖 据 是 从 海量 数据 中 抽取 出 趋势 和 模式 的 最 好 的 方法 。 数 据 挖掘 能 够 在 数据 仓 
库 中 发 现 一 些 查询 和 报表 不 能 有 效 发 现 的 信息 。 


数据 挖 所 (Data Mining) ”从 大 型 数据 库 提取 出 有 效 的 、 先 前 不 知道 的 、 可 理解 的 、 


可 控制 的 信息 的 程序 ， 并 用 它 作 出 重大 的 商业 决策 的 过 程 。 


数据 挖掘 与 数据 分 析 和 为 寻找 隐 蕊 在 数据 集中 的 未 知 的 模式 和 关系 而 使 用 的 软件 技术 有 
关 ， 数 据 挖掘 关 注 的 是 发 现 隐藏 的 未 知 的 信息 ， 因 为 发 现 很 明显 的 模式 和 关系 几乎 没有 任何 
意义 。 检 查 数据 中 隐藏 的 规则 和 特征 能 够 确定 模式 和 关系 。 

数据 挖 据 分 析 人 员 往 往 基于 数据 工作 ， 而 得 出 最 精确 结果 的 技术 通常 要 求 利 用 大 量 的 数 
据 来 得 到 可 靠 的 结论 。 在 分 析 过 程 中 ， 首 先 为 样本 数据 结构 开发 一 个 最 优 表示 ， 并 在 这 个 过 
程 中 获得 知识 。 这 个 知识 接着 被 扩展 到 大 量 的 数据 集中 ， 假 定 那个 稍 大 一 些 的 数据 集 拥有 一 
个 和 样本 数据 相似 的 结构 。 

数据 控 据 可 以 为 已 经 在 数据 仓库 方面 大 量 投资 的 公司 带 来 丰厚 的 回报 。 尽 管 数据 挖掘 仍 
然 是 一 个 相对 新 的 技术 ， 但 它 已 经 在 很 多 领域 中 得 到 了 应 用 。 表 19-2 列 出 了 数据 控 气 在 零售 
业 / 市 场 营销 、 银 行业 、 保 险 业 、 药 业 方面 的 数据 挖 据 应 用 的 例子 。 

表 19-2 数据 控 所 应 用 举例 








零售 业 /市 场 营 销 保险 业 

确定 顾客 的 购买 模式 提出 分 析 

发 现 顾客 的 统计 特征 之 间 的 关联 预测 会 购买 新 保险 方案 的 顾客 

预测 通过 邮件 促销 的 反应 情况 药 业 

市 场 篮子 分 析 通过 刻画 病人 行为 特征 来 预测 外 科 的 访问 率 
银行 业 针对 不 同 的 病 ， 确 定 成 功 的 药物 治疗 方案 
检查 欺诈 信用 卡 的 使 用 模式 

确定 贵 实 级 顾客 

预测 可 能 会 改变 他 们 的 信用 卡 关系 的 顾客 

决定 由 顾客 群 共同 使 用 的 信用 卡 


数据 挖 据 技 术 有 四 个 主要 的 操作 ， 包 括 预测 建 模 、 数 据 库 分 割 、 链 接 分 析 和 违反 检测 。 尽 
管 四 个 主要 的 操作 中 的 任何 一 个 都 可 以 用 来 实现 表 19-2 中 列 出 的 商业 应 用 ， 但 在 应 用 和 相应 的 
操作 中 有 一 定 的 关系 。 例 如 ， 直 接 市 场 营销 策略 通常 使 用 数据 库 分 割 操作 来 实现 ， 而 欺诈 检测 
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可 以 使 用 四 种 方法 中 的 任 一 种 来 实现 。 而 且 ， 很 多 应 用 在 多 种 操作 同时 使 用 时 工作 的 特别 好 。 
例如 ， 一 个 常见 的 寻找 顾客 方法 就 是 先 分 割 数据 库 ， 然 后 对 结果 数据 片断 进行 预测 建 模 。 

实现 数据 挖 据 操 作 的 技术 随 操 作 的 不 同 而 不 同 ， 但是， 每 种 操作 都 有 它 自 身 的 长 处 和 弱 
点 。 记 住 ， 有 时 候 数 据 挖 据 工 具 提 供 了 操作 方法 的 选择 来 实现 某 个 技术 。 选 择 常常 基于 一 . 定 
的 输入 数据 类 型 、 挖 气 输 出 的 透明 性 、 对 缺失 变量 值 的 容忍 程度 、 可 能 的 准确 水 平 、 增 长 的 
处 理 海量 数据 的 能 力 等 。 


19.8 网 络 数据 库 集成 和 XML 


自从 1989 年 出 现 万 维 网 ， 仅 仅 十 几 年 的 时 间 它 就 成 为 到 目前 为 止 最 受 欢迎 、 功 能 最 强大 
的 网 络 信息 系统 。 在 过 去 几 年 里 ， 它 几乎 呈 指 数 级 发 展 ， 它 引发 了 信息 昔 命 并且 将 在 今后 十 
年 内 继续 飞速 发 展 。 现 在 ， 将 网 络 和 数据 库 结合 给 创造 高 级 数据 库 应 用 提供 了 很 多 新 的 机 会 
(我 们 在 19.1 节 中 给 出 了 一 个 例子 )。 

网 络 是 传递 和 分 发 数据 中 心 的 最 引 人 注 目的 平台 ， 企 业 现在 正 迅速 地 利用 网 络 开发 新 的 
数据 库 应 用 程序 或 重建 现 有 系统 ， 将 它 作为 实现 新 颖 商业 解决 方案 的 战略 平台 ， 并 有 效 成 为 
以 网 络 为 中 心 的 组 织 。 

内 特 网 最 初 和 ARPANET 网 中 一 系列 结 点 相连 ， 在 1997 年 1 月 因特网 大 约 拥有 了 超过 .人 
的 用 户 ?。 一 年 之 后 ， 估计 在 超过 100 个 国家 拥有 了 2.7 亿 用 户 ， 到 2001 年 初 ， 估 计 用 户 人 数 达 
到 了 3.9 亿 ， 而 到 了 2003 年 则 增长 到 了 6 亿 多 。 有 一 个 组 织 预言 到 2004 年 ， 用 户 将 增长 到 9.417 、 
而 且 ， 有 些 人 估计 现在 因特网 上 有 将 近 25 亿 个 文档 ， 每 天 增加 750 万 个 。 如 果 我 们 将 企业 内 部 
网 和 外 部 网 上 的 文档 都 加 在 一 起 ， 文 档 数量 将 达 8000 亿 ， 这 简直 令 人 难以 相信 。 


19.8.1 静态 和 动态 的 网 页 


奔 储 在 文件 中 的 HTML/XML 文 档 是 静态 网 页 的 一 个 例子 ， 静 态 文档 的 内 容 不 会 改变 ， 除 
非 文件 自身 被 修改 了 。 而 一 个 动态 网 页 的 内 容 将 在 每 次 访问 它 时 生成 结果， 动态 网 页 拥有 
静态 网 页 没有 的 一 些 特征 ， 例 如 : 

“ 它 林 以 响应 来 自 浏览 器 的 用 户 输 入 。 例 如 ， 通 过 表单 的 形式 返回 请 求 的 结果 或 数据 库 的 

查询 结果 。 

“ 它 可 以 为 每 个 用 户 定制 。 例 如 ， 如 果 一 个 用 户 在 访问 某 个 网 站 或 网 页 时 指定 了 特别 的 爱好 

‘如 兴趣 领域 、 专 业 层次 ) ， 则 该 信息 可 以 被 收集 起 来 ， 并 返回 合乎 他 们 襄 好 的 信息 。 

如 果 文 档 作 为 动态 文档 发 布 ， 比 如 那些 由 数据 库 查 询 产生 的 文档 ， 则 超 文本 需要 由 服 务 
生年 成。 为 了 实现 该 功能 ， 我 们 可 以 编写 脚本 来 实现 不 同 数 据 格式 向 HTML 的 转化 。 这 些 关 
和 语言 也 应 该 能 够 解释 HTML 形 式 的 客户 端 查询 请 求 ， 能 够 理解 由 拥有 该 数 据 的 应 用 程序 
,如 DBMS) 生成 的 结果 。 由 于 数据 库 是 动态 的 ， 随 着 用 户 的 创建 、 插 入 、 更 新 、 删 除数 据 人 
稚 生 改变 ， 所 以 生成 动态 网 页 比 创建 静态 网 页 更 适合 于 数据 库 应 用 。 我 们 将 简要 讲述 创建 
态 网 页 的 方法 。 

号 在 很 多 网 站 都 是 基于 文件 系统 的 ， 所 以 每 个 网 络 文档 都 是 独立 存储 的 文件 ， 对 于 小 网 
和 该 方法 的 实现 很 简单 但是， 对 于 大 型 网 站 来 说 ， 这 会 导致 严 重 的 管理 问题 ”例如 ”从 
成 天上 态 个 不 同 的 文件 中 的 文档 的 当前 副本 是 很 困难 的 ， 而 维护 这 些 文件 之 间 的 链接 类 寺 





9 ”在 这 里 ， 因 特 网 包括 Web、 E-mail、FTP、Gopher 以 及 Telnet 服 务 。 





就 更 加 困难 了 ， 尤 其 是 当 这 些 文档 是 由 不 同 的 作者 创建 和 维护 时 。 

在 实际 实现 时 产生 了 另 一 个 问题 ， 就 是 现在 很 多 网 站 包含 了 更 多 的 具有 动态 特性 的 信息 ， 
如 产品 和 价格 信息 。 在 数据 库 和 独立 的 HTML/XML 文 件 中 维护 这 些 信息 是 一 项 非常 庞大 的 工 
作 ， 而 且 很 难保 持 同 步 。 由 于 这 样 或 那样 的 原因 ， 人 允许 直接 从 Web 中 访问 数据 库 是 目前 日 益 
广泛 采用 的 方法 ， 这 也 是 管理 动态 Web 内 容 采 用 的 方法 。 在 数据 库 中 存储 Web 信 息 可 以 替代 文 
件 存储 或 作为 文件 存储 的 补充 。 


19.8.2 Web-DBMS 集 成 需求 


当 很 多 DBMS 厂 商 在 设法 为 Web 提 供 合适 的 数据 库 连 接 解决 方案 时 ， 大 多 数 企 业 要 求 有 一 
种 通用 性 解决 方案 ， 使 得 它们 可 以 不 必 完 全 依赖 于 某 种 技术 。 在 本 节 中 ， 我 们 简要 列举 出 将 
数据 库 应 用 和 Web 集 成 在 一 起 的 一 些 主要 要 求 。 这 些 要 求 是 理想 的 ， 而 且 在 目前 来 说 是 不 能 
完全 实现 的 ， 而 且 有 些 要 求 可 能 要 和 其 他 要 求 进行 一 些 折 中 。 这 些 要 求 如 下 : 

* 以 安全 方式 访问 有 价值 的 企业 数据 的 能 力 。 

。 数据 和 厂商 的 独立 连接 ， 人 允许 自 由 地 选择 现在 或 将 来 的 DBMS、。 

* 数据 库 界 面 的 独立 性 ， 它 不 依赖 于 任何 Web 浏 览 器 或 Web 服 务 器 。 

。 能 够 利用 企业 的 DBMS 的 所 有 特征 的 连接 解决 方案 。 

。 一 个 开放 性 架构 方案 ,允许 各 种 系统 和 技术 的 互 操 作 。 

* 一 个 具有 扩展 性 、 增 长 性 、 能 根据 企业 战略 进行 改变 的 高 性 价 比 解决 方案 ， 有 助 于 降低 

开发 成 本 和 维护 应 用 程序 的 成 本 。 

“支持 跨 多 个 HITP 请 求 的 事务 。 

“* 支 持 基于 会 话 和 应 用 的 认证 。 

。 可 接受 的 性 能 。 

“ 最 小 的 管理 负荷 。 

“ 高 生产 率 的 工具 集 ， 人 允许 以 相对 容易 、 快 速 的 方式 开发 和 维护 应 用 程序 。 


19.8.3 集成 Web 和 DBMS 的 方法 


将 数据 库 和 Web 环 境 集 成 起 来 有 很 多 种 方法 ， 而 且 在 如 今 瞬 息 万 变 的 时 代 ， 新 的 方法 正 
在 不 断 涌现 。 下 面 是 一 些 常 用 的 例子 : 

。 诸 如 JavaScript 和 VBScript 之 类 的 脚本 语言 。 

。 通 用 网 关 接 口 (CGI)， 一 个 早期 的 广泛 使 用 的 技术 。 

。 HTTP cookies 。 

。 扩 展 Web 服 务 器 ， 例 如 Netscape API (NSAPI) 和 Microsoft 的 Internet Information Server API 
(ISAPI). 

。 Java 和 JDBC、SQLJ、Servlets 和 JavaServer Page (JSP)。 

。 特 定 厂商 的 解决 方案 ， 如 Microsoft 的 带 有 Active Server Pages (ASP) 和 ActiveX Data 
Object (ADO) 的 Web Solution Platform， 以 及 Oracle 的 Internet Platform， 它 带 有 Oracle 
Portal 和 Oracle PL/SQL Server Pages (PSP). 


19.8.4 XML 


Web 中 的 大 多 数 文档 是 即时 存储 并 转变 成 HTML 的 。HTML 的 一 个 优点 就 是 它 的 简单 性 ， 
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使 得 它 被 很 多 用 户 使 用 。 但 是 ， 它 的 简单 性 又 是 它 的 缺点 ， 随 着 用 户 对 标记 的 需求 的 增长 ， 
他 们 希望 标记 可 以 简化 他 们 的 工作 并 使 HTML 文 档 更 引 人 注 目 、 更 动态 。 为 了 满足 该 需求 ， 
厂商 提出 了 一 些 特定 浏览 器 的 HTML 标 记 ， 但 它 难 以 开发 复杂 的 、 可 以 广 为 浏 览 的 Web 文 档 。 
为 了 弥补 这 个 不 足 ，World Wide Web Consortium (W3C) 提出 了 一 个 新 的 标准 ， 称 为 XML 
(eXtensible Markup Language、 可 扩展 标记 语言 )， 这 个 语言 可 以 保持 一 般 的 应 用 独立 性 ， 从 
而 使 得 HTML 可 移植 、 功 能 更 强大 。XML 是 SGML (Standard Generalized Markup Language ) 
的 一 个 受 限制 的 版 本 ， 它 是 专门 为 Web 文 档 设计 的 。 例 如 ，XML 支 持 指向 多 文档 的 链接 ， 而 
HTML 链 接 只 能 指向 一 个 目的 文档 。 


XML 一 种 元 语言 (描述 其 他 语言 的 语言 )， 允 许 设计 者 创建 自己 定制 的 标记 来 提供 


在 HTML 中 得 不 到 的 功能 。 


XML 影响 了 程序 设计 中 的 每 个 方面 ， 包 括 图 形 接口 、 舱 入 式 系统 、 分 布 式 系 统 ， 而 且 根 
据 我 们 的 推测 ， 数 据 库 管 理 也 可 以 。 例 如 ， 自 从 XML 描 述 了 数据 的 结构 后 ， 它 就 成 为 定义 异 
构 数据 库 的 结构 和 数据 源 的 一 个 有 效 机 制 。 由 于 XML 能 够 定义 数据 库 的 整体 模式 ， 因 此 可 以 
用 它 来 改变 一 个 Oracle 模 式 的 内 容 ， 例 如 ， 将 它 转 变 成 Informix 或 Sybase 的 模式 。 它 实际 上 已 
经 成 为 了 软件 行业 中 数据 通信 的 标准 ， 而 且 它 迅速 的 替代 了 EDI (Electronic Data Interchange， 
电子 数据 互 换 ) 系统 ， EDI 系 统 曾经 是 企业 间 互 换 数据 的 主要 媒体 。 有 些 分 析 家 相信 XML 技 
术 将 成 为 创建 和 存储 大 多 数 文档 的 语言 ， 包 括 Internet 和 非 Internet 领 域 。 

1. XML 和 数据 库 

随 着 XML 格式 的 数据 量 的 不 断 增 加 ， 存 储 、 检 索 、 查询 这 类 数据 的 需求 也 在 增加 。 据 估 
计 ， 未 来 将 存在 两 种 主要 的 模式 : 以 数据 为 中 心 和 以 文档 为 中 心 。 在 以 数据 为 中 心 模式 中 ， 
XML 将 作为 结构 化 数据 的 存储 和 交换 格式 ， 而 且 按照 一 般 的 规律 ， 很 有 可 能 由 机 器 来 代替 人 
工 的 处 理 和 阅读 。 在 以 数据 为 中 心 的 模式 中 ， 事实 上 以 XML 格式 存储 和 转换 数据 的 可 能 性 很 
小 ， 可 能 常常 使 用 其 他 的 格式 。 在 这 种 情况 下 ， 数据 可 以 存储 在 关系 、 对 象 -关系 或 面向 对 象 
DBMS 中 。 例 如 ，Oracle 已 经 完全 将 XML 集成 到 Oracle 9i 系 统 中 。XML 可 以 使 用 XMLType 或 
CLOB/BLOB (Character/Binary Large Object， 字 符 / 二 进 制 大 对 象 ) 数据 类 型 作为 一 个 完整 的 
文档 存储 在 数据 库 中 ， 或 者 可 以 被 分 解 成 一 些 主要 元 素 并 以 上 述 方式 存储 起 来 。 Oracle 查 询 语 
言 已 经 扩展 成 为 允许 基于 XML 的 内 容 的 查找 。 

在 以 文档 为 中 心 的 模式 中 ， 文档 是 为 人 类 消费 (如 书籍 、 报 纸 、 电子 邮件 等 ) 而 设计 的 。 
由 于 信息 本 身 的 特征 ， 很 多 数据 可 能 是 没有 规律 或 是 不 完整 的 ， 而 且 它 的 结构 可 能 会 快速 或 
不 可 预料 的 改变 。 但 是 ， 关 系 DBMS、 对 象 - 关 系 DBMS 和 面向 对 象 DBMS 不 能 很 好 地 处 理 这 
类 数据 。 内 容 管理 系统 是 处 理 这 类 文档 的 最 重要 的 工具 。 使 用 这 样 的 系统 ， 你 可 能 会 发 现 一 
个 本 地 XML 数据 库 。 


本 地 XML 数据 库 (Native XML Database) 为 XML 文档 (与 文档 中 的 数据 不 同 ) 定 
义 一 个 ( 丈 辑 ) 数据 模型 ， 并 根据 这 个 模型 来 存储 和 检索 文档 。 至 少 ， 该 模型 必须 
包括 元 素 、 属 性 、PCDATA 和 文档 顺序 。XML 文 档 必须 是 ( 远 辑 ) 存储 单位 ， 有 尽管 
它 不 受 潜在 的 物理 存储 模型 的 限制 (因此 没有 排除 传统 的 DBMS )。 


2. 查询 语言 
正如 前 面 提 及 的 ， DBMS 矿 商 已 经 扩展 了 SQL 来 处 理 基于 XML 内 容 的 查询 。 许多 公司 已 















经 联合 起 来 制定 将 XML 扩展 到 SQL 中 的 标准 ， 这 个 工作 被 称 为 SQL/XML， 最 初 的 工作 将 提交 
至 ISO 和 ANSI。 另 外 ，W3C 组 成 了 一 个 XML Query Working Group (查询 工作 组 ) 来 为 XML 
文档 开发 数据 模型 、 在 该 模型 之 上 的 查询 操作 集 以 及 基于 这 些 查 询 操 作 ( 称 为 XQuery ) 的 查 
询 语言 。 查 询 运行 在 单个 文档 或 是 固定 的 文档 集 上 ， 它们 可 以 选择 整个 文档 或 是 符合 基于 文 
档 内 容 和 结构 的 条 件 的 文档 子 集 。 查 询 还 能 基于 所 选 内 容 构造 新 文档 。 最 后 ， 能 像 访 问 数据 
库 一 样 访问 XML 文 档 集 。 

与 Web 相 关 的 技术 在 迅速 变化 ， 很 可 能 我 们 在 未 来 的 几 年 中 会 看 到 这 个 领域 重大 的 发 展 。 


19.9 本 章 小 结 


。 高 级 的 数据 库 应 用 包括 计算 机 辅助 设计 (CAD )、 计 算 机 辅助 制造 业 (CAM)、 办 公 室 信息 
系统 (OIS) 和 多 媒体 系统 、 地 理 信息 系统 (GIS) 以 及 灵活 多 变 的 交互 式 动态 Web 站 点 。 

。 关 系 模型 ， 尤 其 是 关系 系统 有 很 多 缺陷 ， 如 对 现实 世界 实体 的 表达 能 力 弱 、 语 义 过 载 、 
不 能 很 好 地 支持 业务 规则 、 操 作 能 力 有 限 、 处 理 递归 查询 困难 以 及 阻抗 不 匹配 等 。 
RDBMS 的 有 限 的 建 模 能 力 使 得 它 不 适合 高 级 数据 库 应 用 。 

。 一 个 分 布 式 数据 库 是 一 个 逻辑 上 相关 的 、 共 享 的 数据 (以 及 数据 描述 ) 的 一 个 集合 ， 它 
们 物理 上 分 布 在 一 个 计算 机 网 络 上 。DDBMS 是 一 个 能 够 透明 地 管理 分 布 式 数据 库 的 软件 。 
DDBMS 和 分 布 式 处 理 不 同 ， 在 分 布 式 处 理 中 整个 网 络 只 可 以 访问 一 个 集中 式 DBMS 。 
。DDBMS 的 优点 有 ， 它 反映 了 企业 的 结构 ， 能 够 使 远程 数据 更 好 地 共享 ， 提 高 了 可 靠 性 、 
可 用 性 和 性 能 ， 它 更 经 济 ， 而 且 提供 了 模块 的 增长 。 主 要 的 缺点 是 成 本 高 、 复 杂 性 高 、 
缺乏 标准 和 经 验 。 

。 复 制 是 在 一 个 或 多 个 站 点 上 产生 或 生成 数据 的 多 个 拷贝 的 过 程 。 复 制 有 很 多 好 处 ， 包 括 
当 集 中 的 数据 源 超载 时 改进 系统 性 能 ， 增 加 可 靠 性 和 数据 可 用 性 ， 支 持 可 移动 计算 和 有 
助 于 决策 支持 的 数据 仓库 。 . . 

。 一 个 面向 对 象 DBMS (OODBMS) 是 OODB 的 管理 器 。OODB 是 在 OODM 中 定义 的 对 象 
持久 的 、 共 享 的 信息 库 。OODM 是 一 个 捕获 面向 对 象 编程 支持 的 对 象 语义 的 数据 模型 。 
OODBMS 的 优点 包括 丰富 的 建 模 能 力 、 可 扩展 性 、 消 除 阻抗 失 配 、 查 询 语言 表达 能 力 
更 强 。 

。 几 家 重要 的 厂商 已 经 组 成 Object Data Management Group (对 象 数据 管理 组 ，ODMG ) 来 
定义 OODBMS 的 标准 。ODMG 已 经 提出 了 一 个 对 象 模型 用 来 指定 数据 库 对 象 的 语义 的 标 
准 模 型 。 这 个 模型 很 重要 ， 因 为 它 决 定 了 能 被 OODBMS 理 解 并 执行 的 内 置 语义 。 使 用 这 
些 语义 来 设计 的 类 库 和 应 用 程序 应 该 能 够 在 支持 对 象 模型 的 各 种 OODBMS 中 移植 。 

。 扩 展 关系 数据 模型 不 是 单一 的 ， 而 是 出 现 了 一 系列 的 这 种 模型 ， 每 个 模型 的 特点 都 依赖 
于 它 朝 哪个 方向 以 何 种 程度 来 扩展 。 但 是 ， 所 有 的 模型 确实 都 共享 相同 的 基本 关系 表 和 
查询 语言 ， 都 集成 了 一 些 “ 对 象 ”概念 ， 而 且 有 些 模 型 还 能 在 数据 库 中 存储 方法 或 存储 
过 程 /触发 器 。 这 些 系统 现在 通常 被 称 为 对 象 -关系 DBMS (ORDBMS )。 

“数据 仓库 是 一 个 从 一 些 不 同 的 操作 数据 源 中 整理 出 的 固定 的 /集成 的 企业 数据 的 视图 ， 
它 提供 一 系列 最 终 用 户 能 够 使 用 的 、 支 持 从 简单 到 复杂 的 查询 的 访问 工具 , 以 制定 决策 。 
数据 仓库 中 的 数据 是 面向 主题 的 、 集 成 的 、 随 时 间 变 化 的 、 稳 定 的 。 数 据 集 市 是 数据 仓 
库 的 一 个 子 集 ， 它 支持 一 个 特定 的 部 门 或 业务 领域 制定 决策 的 需求 。 
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.OLAP 对 大 量 多 维 数据 集 进行 动态 综合 、 分 析 和 合并 。OLAP 描 述 了 一 种 技术 ， 这 种 技 
术 使 用 综合 数据 的 多 维 数据 视图 来 为 用 于 高 级 分 析 目 的 的 决策 信息 提供 快速 访问 。 

。 数 据 挖掘 是 从 大 型 数据 库 提取 出 有 效 的 、 以 前 不 知道 的 、 可 理解 的 、 可 用 信息 的 过 程 ， 
可 以 用 它 来 作出 重大 的 商业 决策 。 

。Web 是 到 目前 为 止 最 受 欢 迎 、 功 能 强大 的 网 络 信息 系统 。 为 了 避免 在 静态 网 页 之 外 元 余 
地 存储 数据 库 中 的 数据 ， 将 操作 数据 库 和 Web 环 境 集成 起 来 是 很 重要 的 。 集 成 Web 和 数据 
库 有 很 多 种 方法 ， 而 且 在 技术 成 熟 之 后 ， 该 领域 很 可 能 在 今后 几 年 中 会 有 很 大 的 改变 。 

.XML (可 扩展 标记 语言 ) 是 一 种 元 语言 (描述 其 他 语言 的 语言 )， 人 允许 设计 者 创建 自己 
定制 的 标记 来 提供 在 HTML 中 得 不 到 的 功能 。XML 可 以 影响 程序 设计 中 的 每 一 部 分 ， 包 
括 数据 库 管 理 。 


复习 题 
19.1 
19.2 
19.3 
19.4 


19.5 
19.6 
19.7 
19.8 
19.9 
19.10 
19.11 
19.12 
19.13 
19.14 
19.15 
19.16 


19.17 


讨论 高 级 数据 库 应 用 的 一 般 特 征 。 

讨论 为 什么 关系 数据 模型 和 关系 DBMS 的 缺陷 使 得 它们 不 适合 于 高 级 数据 库 应 用 。 
解释 DDBMS 的 含义 ， 并 讨论 提供 这 样 一 个 系统 的 动机 。 

比较 并 对 比 DDBMS 和 分 布 式 处 理 。 在 哪 种 环境 下 ， 你 会 选择 DDBMS 而 不 是 分 布 式 
处 理 ? 

讨论 DDBMS 的 优点 和 缺点 。 

描述 希望 复制 服务 器 提供 的 功能 。 

比较 并 对 比 复制 的 不 同 所 有 权 模型 。 为 你 的 答案 举 几 个 例证 。 

给 出 OODBMS 的 定义 ，OODBMS 的 优点 和 缺点 是 什么 ? 

给 出 ORDBMS 的 定义 ，ORDBMS 的 优点 和 缺点 是 什么 ? 

给 出 数据 仓库 的 定义 ， 讨 论 建立 一 个 数据 仓库 的 好 处 。 

描述 数据 仓库 中 存储 的 数据 的 特征 。 

讨论 数据 集 市 和 数据 仓库 的 区 别 ， 并 指出 建立 数据 集 市 的 主要 理由 。 

讨论 什么 是 联机 分 析 处 理 (OLAP)， 以 及 OLAP 和 数据 仓库 的 不 同 之 处 。 

描述 OLAP 应 用 程序 ， 并 指出 这 些 应 用 程序 的 特征 。 

讨论 数据 挖掘 是 怎样 实现 数据 仓库 的 价值 的 。 

为 什么 我 们 希望 从 操作 性 数据 库存 储 的 数据 中 动态 地 生成 一 个 网 页 ? 列 出 Web 与 
数据 库 集成 的 一 些 要 求 。 

什么 是 XML? 讨论 管理 基于 XML 的 数据 的 方法 。 





附录 A 可 选 的 数据 建 模 表示 法 
附录 B 数据 库 设计 方法 学 总 结 
附录 C 高 级 数据 库 逻辑 设计 
附录 D 文件 组 织 和 索引 
附录 E 常用 数据 模型 


附录 A 可 选 的 数据 建 模 表示 法 


在 这 个 附录 中 你 将 学 到 : 

。 可 选 的 数据 建 模 表示 法 。 : 

在 第 7 章 ， 我们 学 习 了 怎样 使 用 一 种 正在 发 展 的 流行 的 表示 符号 ， 称 为 UML (统一 建 模 
语言 )， 来 建立 实体 -关系 模型 (ER 模型 )。 在 这 个 附录 中 ， 你 将 看 到 两 种 其 他 的 经 常用 于 建立 
ER 模型 的 表示 法 。 第 一 种 叫做 Chen 氏 表示 法 ， 第 二 种 叫做 Crow 的 Feet 表示 法 。 我 们 通过 在 
ER 模型 的 主要 信念 中 应 用 这 些 符 号 来 说 明 这 两 种 表示 法 ， 然后 用 图 9-9 所 示 的 ER 模型 的 例子 
来 说 明 这 些 表示 法 。 


A.1 使 用 Chen 氏 表示 法 的 ER 模型 


表 A-1 列 出 了 在 ER 模型 中 的 Chen 氏 表示 法 。 图 A-1 显 示 了 用 Chen 氏 表示 法 来 重新 画 的 图 9-9 
所 示 的 模型 。 
表 A-1 ER 模型 的 Chen 氏 表示 法 
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诗 及 


带 有 角色 名 的 递归 关系 ， 
用 来 标识 实体 中 的 关系 





一 对 一 关系 (1 : 1) 


一 对 多 关系 (1 : M) 


多 对 多 关系 (M : N) 


用 于 实体 A 和 B 的 带 有 强 
制 参与 的 1:M 关 系 


实体 A 为 可 选 参与 ， 实 
体 B 为 强制 参与 的 1:M 关 系 


用 于 A、B 的 带 有 可 选 参 
与 的 1:M 关 系 


实体 A、B、C 之 间 的 三 
元 关系 


泛 化 / 特 化 。 如 果 贺 中 包 
含 “d” 关 系 则 是 无 连接 。 
如 果 贺 中 包含 “0” 则 是 非 
连接 ， 从 超 类 引出 的 双 线 表 
示 强 制 参与 ， 单 线 表示 可 选 
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图 A-1 用 Chen 氏 表示 法 的 ER 模型 
A.2 使 用 Crow 的 Feet 表 示 法 的 ER 模型 


表 A-2 列 出 了 在 ER 模型 中 的 主要 概念 的 Crow 的 Feet 表 示 法 。 图 A-2 显 示 了 用 Crow 的 Feet 
表示 法 来 重新 画 的 图 9-9 所 示 的 模型 。 
表 A-2 ER 模型 的 Crow 的 Feet 表 示 法 











带 有 角色 名 的 递归 关系 ， 用 来 
标识 关系 中 实体 的 角色 


属性 列 在 实体 符号 下 面 
主键 属性 带 有 下 划 线 
多 值 属性 放 在 括号 {} 中 


用 于 实体 A 和 B 的 带 强制 参与 
9 一 对 多 关系 


实体 A 带 可 选 参与 ，B 为 强制 
参与 的 一 对 多 关系 


实体 A 和 B 带 可 选 参与 的 一 对 
关系 


实体 A、B、C 之 间 的 三 元 关系 


“ 框 中 框 ”约定 广泛 用 于 表示 
泛 化 / 特 化 ， 并 受 多 种 CASE 工 具 . 
的 支持 ， 包 括 Oracle CASE 
Designer ， 
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图 A-2 使 用 Crow 的 Feet 表 示 法 重 画 的 图 9-9 所 示 的 ER 模型 


Requests 

















附录 B 数据 库 设 计 方 法 学 总 结 


在 这 个 附录 中 你 将 学 到 : 

“ 数据库 设计 由 两 个 阶段 组 成 : 逻辑 和 物理 数据 库 设 计 。 

* 数据库 设 计 方 法 学 中 包含 的 主要 阶段 的 步 驴 。 

在 这 本 书 中 ， 我 们 介绍 了 一 种 关系 数据 库 的 数据 库 设计 方法 学 。 这 种 方法 学 有 两 个 主要 阶 
段 , 逻辑 数据 库 设 计 和 物理 数据 库 设 计 , 这 些 在 第 9 章 、 第 10 章 和 第 12 章 ~ 第 16 章 中 有 详细 介绍 。 
在 这 个 附录 中 ， 我 们 为 那些 已 经 熟悉 了 数据 库 设计 的 读者 总 结 了 这 两 个 阶段 的 设计 步 受 。 


B.1 步骤 1: 创建 并 检查 ER 模型 


任 分 析 阶 段 ， 将 确定 一 系列 的 用 户 视图 。 根 据 交 选 的 数量 ， 为 了 便于 管理 可 能 需要 合并 
一 些 视图 。 这 个 步骤 的 目的 是 为 每 个 这 样 的 视图 (可 能 是 合并 的 ) 构建 一 个 公司 (或 者 是 公 
司 的 一 部 分 ) 的 逻辑 数据 模型 。 


B.1.1 ‘步骤 1.1: 标识 实体 
标识 和 文档 化 公司 视图 中 的 主要 的 实体 。 
B.1.2 步骤 1.2: 标识 关系 


标识 已 经 确定 的 实体 间 存 在 的 主要 关系 ， 确 定 关系 的 多 样 性 约束 。 文 档 化 关系 ， 必要 时 
使 用 ER 模型 。 


B.1.3 步骤 1.3: 标识 实体 或 关系 的 有 关 属 性 


将 属性 与 合适 的 实体 和 关系 关联 起 来 ， 表 示 简 单 /复合 的 属性 、 单 值 /多 值 属 性 和 派生 的 属 
性 ， 文档 化 属性 。 


B.1.4 步骤 1.4: 确定 属性 域 
确定 ER 模型 中 的 属性 的 域 ， 文 档 化 属性 域 。 
B.1.5 步骤 1.5: 确定 候选 键 、 主 键 和 备用 键 属性 


为 每 个 实体 确定 候选 键 ， 如 果 有 多 于 一 个 的 候选 键 ， 则 选择 其 中 的 一 个 作为 主键 ， 其 他 
的 作为 备用 键 。 对 每 个 实体 的 候选 键 、 主 键 和 备用 键 进行 存档 


B.1.6 步骤 1.6: 特 化 / 泛 化 实体 (可 选 步骤 ) 
如 果 合 适 的 话 ， 标 识 超 类 和 子 类 实体 。 
B.1.7 步骤 1.7: 检查 模型 的 数据 元 余 
检查 ER 模型 确保 没有 元 余 ， 特别 要 反复 检查 1:1 关 系 并 删除 元 余 关 系 。 
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B.1.8 步骤 1.8: 检查 模型 是 否 支持 用 户 事务 
确保 ER 模型 支持 用 户 所 需 的 视图 事务 。 
B.1.9 步骤 1.9: 与 用 户 一 起 检查 模型 
B.2 步骤 2: 将 ER 模型 映射 为 表 
将 ER 模型 映射 为 一 组 表 ， 并 检查 表 的 结构 。 


B.2.1 步骤 2.1: 映射 表 


在 这 一 步 又 中 ， 我 们 为 步骤 1 创建 的 ER 模型 建立 基本 表 来 描绘 实体 、 关 系 、 属 性 和 约 
束 。 表 结构 是 从 描述 ER 模型 描述 的 信息 中 派生 出 来 的 。 这 些 信息 包括 数据 字典 和 其 他 描 
述 模型 的 文档 。 同 样 ， 要 为 在 给 ER 模型 创建 表 的 过 程 中 产生 的 新 的 主键 和 候选 键 建立 文 
档 。 

建立 表 的 基本 规则 如 下 : 

。 为 每 个 实体 建立 一 个 包括 这 个 实体 的 所 有 简单 必 性 的 表 。 

* 可 用 主键 /外 键 机 制 来 描述 每 个 关系 。 为 了 确定 外 键 ， 必 须 在 关系 中 标识 父 实体 和 子 实 

体 。 父 实体 把 它 的 一 个 主键 放置 到 子 实体 中 ， 作 为 外 键 。 表 B-1 给 出 了 从 ER 模型 创建 表 


的 规则 。 
表 B-1 如 何 将 实体 、 关 系 和 多 值 属性 表达 为 表 的 总 结 

实体 /关系 /属性 表达 为 表 

强 实体 或 弱 实 体 创建 包含 所 有 简单 属性 的 表 

1:* 二 元 关系 将 “一 ” 端 实体 的 主键 复制 到 表达 “多 ” 端 实体 的 表 中 ， 关 系 
中 的 任何 属性 也 复制 到 “多 ”端的 表 中 

1:* 递 归 关系 “一 ”端的 实体 和 “多 ”端的 实体 是 一 样 的 ， 代 表 实 体 的 表 有 
主键 的 另 一 个 拷贝 ， 这 个 拷贝 是 被 重 命名 的 ， 并 且 有 关系 的 其 他 
属性 

1:1 二 元 关系 : 

两 端 都 是 强制 参与 将 实体 组 合成 一 张 表 

一 端 是 强制 参与 将 有 可 选 参与 的 实体 的 主键 复制 到 表达 有 强制 参与 的 实体 的 表 
中 ,关系 的 任何 属性 也 被 复制 到 表达 有 强制 参与 的 实体 的 表 中 

两 端 都 是 可 选 参 与 没有 更 多 的 信息 ， 将 一 个 实体 的 主键 拷贝 到 另 一 个 实体 中 。 但 
如 果 信 息 是 可 获得 的 ， 则 将 更 具有 强制 参与 的 实体 作为 子 实体 

*:* 一 元 关系 /复杂 关系 创建 表达 关系 的 表 ， 此 表 中 包含 任何 与 关系 有 关 的 属性 ， 将 每 
个 父 实体 中 的 主键 复制 到 新 表 中 作为 外 键 

多 值 属性 创建 一 个 表达 多 值 属性 的 表 ， 并 将 父 实体 的 主键 复制 到 新 表 中 
作为 外 键 


“对 每 个 超 类 / 子 类 关系 ， 可 以 定义 超 类 作为 父 实体 而 子 类 为 子 实体 。 关于 如 何 最 好 地 
描述 这 样 的 关系 为 一 个 表 或 多 个 表 ， 有 各 种 不 同 的 方法 。 对 最 合适 方法 的 选择 基于 在 
超 类 / 子 类 关系 中 的 参与 约束 和 无 连接 的 约束 ， 表 B-2 给 出 了 如 何 从 EER 模 型 映射 表 的 








表 B-2 表示 基于 参与 和 无 连接 约束 的 超 类 / 子 类 关系 的 可 选 的 选项 


参与 约束 无 连接 约束 需要 的 表 

强制 非 无 连接 约束 {And} - 张 表 

可 选 非 无 连接 约束 {And} 两 张 表 : 一 个 表 用 于 超 类 ， 另 一 张 表 用 于 所 有 的 子 类 
强制 非 无 连接 约束 {Or} 多 张 表 : 每 个 表 用 于 超 类 / 子 类 的 组 合 

可 选 非 无 连接 约束 {Or} 多 张 表 : -一 张 表 用 于 超 类 ， 其 他 的 用 于 每 个 子 类 


B.2.2 步骤 2.2: 用 规范 化 方法 检查 表 结 构 


这 个 步骤 的 目的 是 检查 在 步 又 2.1 中 建立 的 每 个 表 的 列 的 分 组 。 可 以 用 规范 化 的 规则 检查 
每 个 表 的 组 成 。 每 个 表 最 少 应 该 是 第 三 范式 (3NF) 的 


B.2.3 步骤 2.3: 检查 表 是 否 支持 用 户 事务 


在 这 个 步骤 中 ， 我 们 要 确定 表 是 否 支持 视图 所 需要 的 事务 。 视 图 需要 的 事务 可 以 从 用 户 
需求 说 明 书 确定 。 


B.2.4 步骤 2.4: 检查 业务 规则 


检查 逻辑 数据 库 设 计 中 表达 的 所 有 业务 规则 。 这 些 约束 包括 : 指明 需要 的 数据 、 属 性 域 
约束 、 实 体 完整 性 、 多 样 性 、 参 照 完整 性 和 其 他 业务 规则 。 对 所 有 的 整体 性 约束 进行 存档 。 


B.2.5 步骤 2.5: 与 用 户 讨论 逻辑 数据 模型 
确保 逻辑 数据 模型 是 公司 (或 者 是 公司 一 部 分 ) 所 需 数据 的 真实 的 模型 化 描述 。 

B.2.6 步骤 2.6: 构建 并 检查 全 局 逻辑 数据 模型 
合并 单个 的 局 部 逻辑 数据 模型 为 一 个 完整 的 全 局 罗 辑 数据 模型 ， 以 描述 公司 (或 是 公司 的 


， 一部分) 的 数据 要 求 。 





1. 步骤 2.6.1: 合并 局 部 逻辑 数据 模型 为 全 局 模型 

合并 单个 的 局 部 逻辑 数据 模型 为 一 个 完整 的 全 局 逻辑 数据 模型 。 这 个 步骤 的 一 些 基本 的 
任务 如 下 : 

* 回顾 实体 / 表 的 名 字 和 内 容 以 及 它们 的 主键 。 

* 回顾 关系 /外 键 的 名 字 和 内 容 。 

* 从 局 部 数据 模型 合并 实体 / 表 。 

“包含 (不 是 合并 ) 对 每 个 局 部 数据 模型 唯一 的 实体 / 表 。 

“ 从 局 部 逻辑 数据 模型 中 合并 关系 。 

“ 包含 (不 是 合并 ) 在 每 个 局 部 逻辑 数据 模型 中 唯一 的 关系 。 

* 从 局 部 数据 模型 合并 关系 /外 键 。 

“包含 (不 是 合并 ) 对 每 个 局 部 数据 模型 唯一 关系 /外 键 。 


9 当 使 用 视图 集成 方法 创建 多 用 户 视图 数据 库 时 ， 只 需 步 又 2.6。 
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“检查 漏 掉 的 实体 / 表 和 关系 /外 键 。 

。 检 查 外 键 。 

。 检 查 业 务 规则 。 

“ 夯 出 全 局 ER/ 表 图 。 

“更 新 文档 。 

2. 步骤 2.6.2: 检查 全 局 还 辑 数据 模型 

这 个 步骤 的 作用 与 步骤 2.3 和 2.4 相 同 ， 也 是 用 规范 化 检查 为 全 局 数据 模型 建立 的 表 的 结构 ， 
然后 检查 这 些 表 能 否 支持 所 有 的 用 户 事务 。 

3. 落 骤 3.3: 检查 未 来 的 可 变性 

确定 在 可 项 见 的 将 来 是 否 存在 有 意义 的 变化 并 估计 全 局 数据 模型 是 否 能 适应 这 些 变化 ， 

4. 步骤 2.6.4: 与 用 户 讨论 全 局 数据 模型 

确保 我 们 建立 的 全 局 数据 模型 是 公司 ( 或 者 是 公司 的 一 部 分 ) 需要 的 数据 的 真实 描述 。 


B.3 步骤 3: 为 目标 数据 库 管理 系统 转换 全 局 逻辑 数据 模型 
从 逻辑 数据 模型 中 产生 一 个 基本 表 的 工作 集 。 
B.3.1 步骤 3.1: 设计 基本 表 


决定 如 何在 目 标 数据 库 管理 系统 中 表述 在 逻辑 数据 模型 中 建立 的 基本 表 。 为 表 的 设计 建 
立 文档 。 


B.3.2 步骤 3.2: 设计 派生 数据 的 表示 


考虑 如 何 表达 派生 数据 。 需 做 出 的 选择 是 在 每 次 需要 时 计算 派生 列 还 是 引入 元 余 列 来 在 
表 中 存储 派生 数据 。 将 派生 数据 的 设计 存档 . 


B.3.3 步骤 3.3: 设计 其 他 业务 规则 
为 目标 DBMS 设 计 其 他 的 业务 规则 ， 将 对 其 他 业务 规则 的 设计 存档 。 
B.4 步骤 4. 选择 文件 组 织 方式 和 索引 


决定 要 用 来 保存 基本 表 的 文件 组 织 方式 ， 也 就 是 说 ， 表 和 记录 在 辅 存 中 的 存 取 方 式 。 考 
虑 增加 索引 来 提高 性 能 。 


B.4.1 步骤 4.1: 分 析 事 务 

理解 在 数据 库 中 运行 的 事务 的 功能 并 分 析 重要 的 事务 
B.4.2 步骤 4.2: 选择 文件 组 织 方式 

为 每 个 基本 表 确 定 一 个 有 效 的 文件 组 织 方式 ， 
B.4.3 步骤 4.3; 选择 索引 

确定 增加 索引 是 否 会 提高 系统 的 整体 性 能 
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B.5 步骤 5: 设计 用 户 视 图 
设计 在 需求 收集 和 分 析 阶段 标识 的 用 户 视图 。 
B.6 步骤 6: 设计 安全 性 机 制 


为 数据 库 实现 设计 安全 性 机 制 ， 这 些 安全 性 机 制 是 在 需求 收集 和 分 析 阶段 由 用 户 指定 的 。 
将 对 安全 性 机 制 的 设计 存档 。 


B.7 步骤 7: 引入 受 控 元 余 的 考虑 


确定 引入 受 控 的 元 余 以 降低 规范 化 规则 是 否 会 提高 系统 的 整体 功能 。 考 虑 重复 的 列 或 者 
连接 一 些 表 可 以 获得 提高 性 能 的 目的 。 尤 其 是 考虑 合并 一 对 一 (1 : 1) 关系 ,在 一 对 多 (1 :*) 
的 关系 中 重复 非 键 列 来 减少 连接 ， 在 一 对 多 (1 :*) 的 关系 中 重复 外 键 列 来 减少 连接 ， 在 多 
对 多 (* : *) 关系 中 用 重复 列 来 减少 连接 ， 可 以 引入 重复 的 组 ， 建 立 摘要 表 和 分 区 表 。 

B.8 步骤 8: 监视 和 调整 运行 的 系统 


监控 运行 的 系统 并 提高 系统 性 能 来 改进 不 合适 的 设计 决定 或 者 反映 变化 的 需求 。 





附录 C 高 级 数据 库 逻 辑 设计 


在 这 个 附录 中 你 将 学 到 : 

" 怎样 根据 企业 对 数据 的 要 求 将 局 部 逻辑 数据 模型 合并 到 全 局 逻辑 数据 模型 中 。 

* 怎样 确保 最 后 的 全 局 模型 能 够 准确 表示 被 建 模 型 企业 需要 的 数据 ， 

本 附录 描述 了 当 创 建 一 个 有 多 个 用 户 视图 并 且 还 要 对 这 些 用 户 视图 使 用 视图 集成 方法 进 
行 管理 的 复杂 数据 库 系统 时 ， 应 该 如 何 做 。 本 附录 假定 你 已 经 用 第 9 章 和 第 10 章 中 介绍 的 数据 
库 设计 方法 学 的 步骤 1 和 步骤 2 建立 好 了 表达 一 个 和 多 个 用 户 视图 的 局 部 数据 模型 。 

在 第 6 章 中 ， 我 们 确定 了 StayHome 数 据 库 系统 的 几 个 用 户 视图 ， 即 Director、Manager、 
Supervisor、Assistant 和 Buyer。 在 对 每 个 用 户 视图 的 要 求 进行 分 析 后 ， 我 们 决定 使 用 集中 式 
和 视图 集成 方法 来 管理 这 些 用 户 视图 。 我 们 决定 使 用 集中 式 方法 来 合并 Manager、Supervisor、 
人 Assistant 用 户 视图 为 一 个 用 户 视图 集合 ， 这 个 用 户 视图 集合 被 称 为 Branch， 并 将 Director 和 
3uyer 视 图 合并 到 称 为 Business 的 用 户 视图 集合 中 。 在 第 9 章 和 第 10 章 中 ， 我 们 使 用 Branch 用 户 
视图 来 说 明 应 用 方法 学 中 的 步 只 1 和 步 只 2 来 构建 一 个 局 部 逻辑 数据 模型 的 过 程 。E-R 图 如 图 
9-9 所 示 ， 并 且 在 图 10-11 中 显示 了 对 各 表 的 详细 描述 。 

在 本 附录 中 ， 我 们 首先 给 出 了 有 关 StayHome 中 的 Business 用 户 视图 的 用 户 需求 规格 说 明 
节 。 我 们 不 演示 为 这 些 用 户 视图 的 集合 创建 局 部 逻辑 数据 模型 的 步 允 ， 但 我 们 提出 了 逻辑 村 
型 的 重要 组 件 ， 即 B-R 图 和 基于 该 模型 的 表 的 描述 。 然后， 我 们 用 Branch 和 Business 用 户 视图 
的 局 部 罗 辑 数据 模型 来 阐明 怎样 合并 数据 模型 ， 


C.1 StayHome 的 Business 用 户 视 图 


在 这 一 节 中 ， 我 们 提出 了 有 关 StayHome 的 Business 用 户 视图 的 用 户 需 求 规格 说 明 书 和 相 
应 的 局 部 逻辑 数据 模型 。 

提示 你 会 发 现 阅读 下 一 节 中 的 需求 是 非常 有 用 的 ， 然 后 可 以 自己 斌 着 用 方法 学 中 的 步 

骤 1 和 步骤 2， 然后 可 以 将 自 己 的 解决 方案 和 我 们 例子 中 的 解决 方法 比较 一 下 。 


C.1.1 用 户 的 需求 规格 说 明 书 


usiness 用 户 视图 的 需求 规格 说 明 书 列 出 了 两 部 分 内 容 ，- 部 分 描述 了 在 Business 用 户 视 
可 ”要 用 到 的 数据 信息 ， 另 一 部 分 提供 了 怎样 使 用 数据 的 例子 ( 即 在 数据 上 执行 的 事务 ) 

1. 数据 要 求 

在 SayHome 的 分 公司 中 包含 的 详细 信息 包括 分 公司 的 地 址 和 电话 号 玛 。 每 个 分 公司 部 
一 个 全 公司 唯一 的 分 公司 号 。 

Yome 的 每 个 分 公司 都 有 包含 经 理 (Manager) 在 内 的 员工 ， 在 员工 的 详细 信息 有 妹 
名 、 职 位 和 年 新 。 每 个 员工 都 有 一 个 在 全 公司 唯 的 员工 号 。 

“ey Jome 的 每 个 分 公司 保存 有 一 些 录像 。 录 像 的 详细 信息 包括 目录 号 、 录 像 号 、 标 是 
是 租 金 和 购买 价格 。 目 录 号 唯一 地 标识 每 个 录像 。 但 大 多 数 情况 下 ， 在 个 分 公司 中 
每 个 录像 都 会 有 几 盘 相同 的 拷贝 ， 这 些 拷贝 就 使 用 录像 号 来 村 识 。 





一 

StayHome 的 每 个 分 公司 从 录像 供应 商 那 里 得 到 录像 。 录像 供应 商 的 详细 信息 包括 供应 商 
号 、 名 字 、 地 址 、 电 话 号 码 和 状态 。 公 司 从 这 些 供应 商 那 里 订购 录像 ， 订 单 的 详细 信息 包括 
订单 号 、 供 应 商号 、 供 应 商 地 址 、 录 像 目 录 号 、 录 像 标题 、 录 像 购买 价格 、 数 量 、 订 购 日 期 、 
发 货 日 期 和 接收 该 批 录像 的 分 公司 地 址 。 

StayHome 的 顾客 必须 首先 注册 成 为 StayHome 的 某 个 分 公司 的 会 员 。 会 员 的 详细 信息 包括 
名 字 、 地 址 和 该 会 员 注册 成 的 日 期 。 每 个 会 员 有 一 个 给 定 的 会 员 号 ， 用 于 唯一 地 标识 该 会 员 ， 
黄 至 当 访 会员 还 在 其 他 分 公司 注册 的 时 候 ， 也 使 用 这 个 会 员 写 。 

每 个 出 租 录 像 的 详细 信息 包括 出 租 号 、 全 名 、 成 员 号 、 录 像 号 、 标 题 、 日 租金 以 及 出 租 
和 归还 的 日 期 。 其 中 出 租 号 作为 唯一 标识 。 

2. 事务 需求 

(1) 数据 录入 

1) 输入 新 出 版 的 录像 的 详细 信息 (例如 Return of the King (王者 归来 ) 这 部 录像 的 详细 
信息 )。 

2) 输入 录像 供应 商 的 详细 信息 (例如 WorldView Videos 供 应 商 的 信息 )。 

3) 输入 录像 订单 的 详细 信息 〈 例 如 B002 分 公司 定购 了 10 盘 Retum of the King)。 

(2) 数据 更 新 /删除 

4) 更 新 /删除 已 有 录像 的 详细 信息 。 

5) 更 新 /删除 已 有 的 录像 供应 商 的 详细 信息 。 

6) 更 新 /删除 已 有 的 录像 订单 的 详细 信息 。 

(3) 数据 查询 

7) 列 出 所 有 分 公司 中 职员 的 名 字 、 职 位 和 工资 ， 按 分 公司 号 排序 

8) 列 出 给 定 分 公司 的 经 理 的 名 字 和 电话 号 码 。 

9) 列 出 给 定 分 公司 中 所 有 的 录像 的 目录 号 和 标题 ， 按 标题 排序 。 

10) 列 出 给 定 分 公司 号 的 给 定 录像 的 拷贝 的 数量 。 

11) 列 出 每 个 分 公司 会 员 的 数目 ， 按 分 公司 号 排序 。 

12) 列 出 每 个 分 公司 中 今年 加 入 的 会 员 的 数目 ， 按 分 公司 号 排序 

13) 列 出 某 两 个 日 期 之 间 每 个 分 公司 出 租 的 录像 的 数目 ， 按 分 公司 号 排序 。 

14) 列 出 给 定 分 公司 中 ， 每 种 类 别 中 录像 的 数目 ， 按 类 别 排序 。 

15) 列 出 所 有 录像 供应 商 的 名 字 、 地 址 和 电话 号 码 ， 按 供应 商号 码 排序 

16) 列 出 录像 供应 商 的 名 字 和 电话 号 码 。 

17) 列 出 给 定 的 录像 供应 商 的 所 有 订单 的 详细 信息 ， 按 照 订 单 的 日 期 排序 。 

18) 列 出 某 个 日 期 所 签订 的 所 有 订单 的 详细 信息 。 

19) 列 出 在 给 定 日 期 之 间 ， 每 个 分 公司 的 全 部 日 租金 ， 按 照 分 公司 号 排序 。 


C.1.2 局 部 逻辑 数据 模型 


正如 我 们 刚刚 提 到 的 ， 不 需要 再 为 StayHome 的 Business 视 图 构建 局 部 逻辑 数据 模型 ， 我 


们 假定 在 方法 学 的 步骤 1 和 步骤 2 中 已 经 构造 了 该 模型 ， 并 且 给 出 了 逻辑 模型 的 重要 部 分 ， 即 
* ER 图 ， 参 见 图 C-1。 


。 表 ， 参 见 图 C-2。 
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图 C:2 StayHome 的 Business 视 图 的 表 


吕 在 让 我 们 使 用 Branch 和 Business 局 部 逻辑 数据 模型 来 构建 Stayfome 的 全 局 逻辑 数据 关 
型 。 我 们 下 面 将 描述 合并 两 个 数据 模型 的 过 程 ， 包括 给 第 10 章 中 描述 的 逻辑 数据 库 设 计 方法 





hx 


学 的 步骤 2 增加 一 个 附加 步 旦 。 


C.2 步骤 2.6: 构建 并 检查 全 局 逻辑 数据 模型 


目标 “将 每 个 局 部 远 辑 数据 模型 合并 成 一 个 全 局 还 辑 数据 模型 ， 该 模型 代表 了 需要 建 
立 模型 的 组 织 〈 或 组 织 的 一 部 分 ) 的 数据 要 求 。 


在 步 又 2 的 这 个 子 步 又 中 ， 将 构建 一 个 全 局 逻辑 数据 模型 ， 它 通过 合并 数据 库 中 每 个 用 户 
视图 产生 的 局 部 逻辑 数据 模型 ， 来 表示 所 有 用 户 视图 。 但是， 如果 你 使 用 集中 式 方法 来 管理 多 
个 用 户 视图 ， 那 么 一 个 局 部 逻辑 数据 模型 就 代表 了 两 个 或 更 多 用 户 视图 的 合并 后 的 要 求 。 将 模 
型 合成 在 一 起 ， 检 查 在 全 局 模型 上 使 用 的 所 有 表 都 是 规范 化 的 ， 并 且 仍然 能 够 支持 需要 的 事务 
是 很 必要 的 ， 就 像 第 10 章 步骤 2.2 和 步骤 2.3 中 做 的 那样 。 但 是 ， 你 只 需 检查 那些 在 合并 过 程 中 
发 生 了 变化 的 部 分 。 在 一 个 大 系统 中 ， 这 将 显著 碱 少 进行 重新 检查 的 工作 量 。 

尽管 每 个 局 部 逻辑 数据 模型 都 应 该 是 正确 的 、 全 面 的 、 内 容 明确 的 ， 但 是 毕竟 每 个 模型 
仅仅 是 一 个 或 多 个 (而 不 是 全 部 ) 数据 库 用 户 视图 的 表达 。 换 句 话说 ， 这 个 模型 从 严格 意义 
上 来 说 并 不 是 一 个 企业 组 织 功能 的 模型 ， 而 是 一 个 或 多 个 用 户 视图 的 模型 ， 所 以 它 可 能 是 不 
完整 的 。 这 就 意味 着 ， 当 你 查看 用 户 视图 的 全 部 集合 时 ， 可 能 会 发 现 不 一 致 现象 或 是 重合 现 
象 。 因 此 ， 当 将 局 部 逻辑 数据 模型 合并 成 一 个 全 局 模型 时 ， 必 须 解决 各 个 用 户 视图 之 间 存在 
的 冲突 和 重要 现象 。 

在 步 只 2.6 中 涉及 到 的 工作 有 : 

* 步骤 2.6.1: 将 局 部 逻辑 数据 模型 合并 成 全 局 模型 

“ 步骤 2.6.2: 检查 全 局 逻辑 数据 模型 

* 步骤 2.6.3: 考虑 未 来 的 增长 情况 

“ 步 又 2.6.4: 和 用 户 共同 评审 全 局 逻辑 数据 模型 


C.2.1 步骤 2.6.1: 将 局 部 逻辑 数据 模型 合并 成 全 局 模型 


目标 将 每 个 局 部 运 辑 数据 模型 合并 成 一 个 全 局 逻辑 数据 模型 。 


现在 ， 已 经 为 每 个 局 部 逻辑 数据 模型 建立 了 ER 图 、 一 组 表 、 一 个 数据 字典 和 一 些 描述 了 
数据 约束 的 支持 文档 。 在 这 个 步 又 中 ， 为 了 合并 模型 ， 可 以 使 用 这 些 已 有 的 内 容 来 标识 模型 
间 的 相似 和 不 同 之 处 。 

对 于 一 个 拥有 较 少 的 实体 / 表 的 简单 数据 库 系 统 来 说 ， 比 较 局 部 模型 、 把 它们 合并 到 一 起 
并 解决 存在 的 分 歧 是 一 件 容易 的 事 。 但 是 ， 在 一 个 大 型 系统 中 ， 必 须 采 用 一 个 更 加 系统 化 的 
实现 过 程 。 下 面 提出 了 一 种 方案 ， 可 以 用 于 将 局 部 模型 合并 在 一 起 并 解决 所 有 可 以 发 现 的 不 
一 致 性 问题 。 这 个 方案 的 关键 工作 包括 : 

1) 检查 实体 / 表 的 名 字 和 内 容 ， 以 及 它们 的 主键 。 

2) 检查 关系 /外 键 的 名 字 和 内 容 。 

3) 合并 局 部 数据 模型 中 的 实体 / 表 。 

4) 包含 (不合 并) 对 每 个 局 部 数据 模型 来 说 唯一 的 实体 / 表 。 

5) 合并 来 自 局 部 数据 模型 的 关系 /外 键 。 

6) 包含 (不 合并 ) 对 每 个 局 部 数据 模型 来 说 唯一 的 关系 /外 键 。 
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7) 检查 是 否 有 丢失 的 实体 / 表 和 关系 /外 键 。 

8) 检查 外 键 。 

9) 检查 完整 性 约束 。 

10) 画 出 全 局 ER 图 和 表 。 

11) 更 新 文档 。 

在 上 述 工作 中 ， 我 们 使 用 了 术语 “实体 / 表 ” 和 “关系 /外 键 ”"， 因 为 你 可 能 希望 : 

* 检查 ER 图 和 它们 支持 的 文档 。 

* 检查 根据 ER 图 和 支持 文档 创建 出 来 的 表 。 

。 使 用 上 述 两 种 信息 源 的 综合 。 

提示 也 许 合并 几 个 局 部 数据 模型 的 最 简单 的 方法 是 ， 首 先 合 并 其 中 的 两 个 模型 成 为 一 
个 新 的 模型 ， 然 后 相继 合并 其 余 的 局 部 数据 模型 ， 直 到 将 所 有 的 局 部 模型 合并 到 最 终 
的 全 局 数据 模型 中 为 止 。 这 可 能 要 比 同 时 合并 所 有 的 局 部 数据 模型 更 简单 。 


为 了 确保 可 比较 性 ， 创建 每 个 局 部 模型 时 都 应 遵循 方法 学 中 的 步骤 1 和 步 又 2 是 很 重要 的 。 

* 检查 实体 / 表 的 名 字 和 内 容 ， 以 及 它们 的 主键 

通过 检查 数据 字典 ， 检 查 出 现在 局 部 数据 模型 中 的 实体 / 表 的 名 字 。 当 有 两 个 或 多 个 实体 / 
表 时 ， 可 能 会 出 现 如 下 问题 : 

1) 名 字 相 同 ， 但 实际 上 并 不 是 同一 个 实体 / 表 (异物 同名 )。 

2) 实体 / 表 相 同 ， 但 却 有 不 同 的 名 字 ( 同 物 异 名 )。 

为 了 解决 这 些 问 题 ， 比 较 每 个 实体 / 表 中 的 数据 内 容 是 必要 的 。 特 别 地 ， 可 以 使 用 主键 
(或 候选 键 ) 去 标识 视图 间 命名 不 同 的 等 价 的 实体 / 表 。StayHome 中 Branch 和 Business 视 图 的 实 
体 / 表 和 主键 的 比较 见 表 C-1。 每 个 视图 的 共同 的 实体 / 表 用 黑体 显示 。 

表 C-1 StayHome 中 Branch 和 Business 视 图 的 实体 / 表 及 主键 的 比较 


Branch 用 户 视 图 Business 用 户 视图 

表 主键 表 主键 

Branch branchNo Branch branchNo 

Staff staffNo Staff staffNo 

Telephone telNo 

Video catalogNo Video catalogNo 

VideoForRent videoNo VideoForRent videoNo 
Supplier supplierNo 
VideoOrder orderNo 
VideoOrderLine orderNo, catalogNo 

RentalAgreement rentalNo RentalAgreement rentalNo 

Member memberNo Member memberNo 

Registration branchNo, memberNo Registration branchNo, memberNo 

Actor actorNo 

Role catalogNo, actorNo 


Director directorNo 


* 检查 关系 /外 键 的 名 字 和 内 容 
这 和 描述 实体 / 表 的 工作 相同 ，StayHome 中 Branch 和 Business 用 户 视图 中 的 关系 /外 键 的 比 
较 如 表 C-2 所 示 。 在 两 个 视图 中 公共 的 关系 /外 键 用 粗 体 显 示 。 
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表 C-2 StayHome 中 Branch 和 Business 视 图 中 关系 /外 键 的 比较 


Branch 用 户 视图 Business 用 户 视图 
子 表 ”外 刍 父 表 子 表 外 键 父 表 

Branch MegrStaffNo— Staff(staffNo) Branch MerStaffNo ~— Staff(staffNo) 

Telephone branchNo— Branch (branchNo) 

Registration branchNo— Branch(branchNo) 入 egistration branchNo 一 Branch (branchNo) 
memberNo—= Member(memberNo) memberNo— Member(memberNo) 
staffNo ~ Staff(staffNo) 

Staff branchNo 一 Branch (branchNo) Staff branchNo ~ Branch (branchNo) 
Supervisor Staff(staffNo) 

StaffNo 一 

Video directorNo 一 Director(directorNo) Video supplierNo — Supplier(supplierNo) 

VideoForRent catalogNo 一 Video (catalogNo) VideoForRent catalogNo — Video (catalogNo) 
branchNo 一 Branch(branchNo) branchNo 一 Branch (branchNo) 

RentalAgree- memberNo— Member(member- RentalAgreement memberNo— Member(memberNo) 

ment No) 
videoNo— VideoForRent videoNo— VideoForRent(videoNo) 

(videoNo) 
VideoOrder branchNo 一 Branch (branchNo) 
VideoOrderLine orderNo ~ Video0rder(orderNo) 
catalogNo 一 Video (catalogNo) 
Role actorNo 一 Actor(actorNo) 


catalogNo ~ Video (catalogNo) 


* 从 局 部 数据 模型 中 合并 实体 / 表 

应 该 检查 模型 中 要 被 合并 的 每 个 实体 / 表 的 名 称 和 内 容 ， 以 决定 是 否 这 些 实体 / 表 代表 同样 
的 事物 ， 因 而 能 被 合并 。 这 项 任务 一 般 包 括 如 下 步骤 : 

1) 合并 名 称 相同 、 主 键 相同 的 实体 / 表 。 

2) 合并 名 称 相同 、 主 键 不 同 的 实体 / 表 。 

3) 合并 名 称 不 同 、 主 键 相同 或 不 同 的 实体 / 表 。 

4) 包含 (不合 并) 对 每 个 局 部 数据 模型 而 言 是 唯一 的 实体 / 表 

前 面 的 任务 应 该 已 标识 出 所 有 相同 的 实体 / 表 。 而 所 有 剩余 的 实体 / 表 不 用 进行 任何 变化 就 
可 以 加 入 到 全 局 模型 中 。 

“从 局 部 数据 模型 中 合并 关系 /外 键 

在 这 个 步 又 中 ， 检 查 数据 模型 中 的 每 一 个 关系 的 名 称 和 目标 。 在 合并 关系 /外 键 之 前 ， 消 
除 关系 中 的 冲突 是 很 重要 的 ， 比 如 多 样 性 约束 不 同 。 这 个 步骤 主要 包括 合并 名 称 相 同 、 目 标 
相同 的 关系 /外 键 ， 然 后 合并 名 称 不 同 、 目 标 相同 的 关系 /外 键 。 

“包含 (不 合并 ) 对 每 个 局 部 数据 模型 来 说 是 唯一 的 关系 /外 刍 

前 面 的 工作 应 该 标识 了 相同 的 关系 /外 键 (通过 定义 ， 它们 必须 是 相同 实体 / 表 间 的 关系 ， 
这 些 实体 / 表 在 前 边 已 经 被 合并 了 )。 所 有 剩 下 的 关系 不 用 做 任何 变化 就 可 以 加 入 全 局 模型 中 。 

" 检查 是 否 有 遗漏 的 实体 / 表 和 关系 /外 键 

也 许 创建 全 局 模型 时 最 复杂 的 任务 之 一 就 是 标识 不 同 局 部 数据 模型 闻 缺 失 的 实体 / 表 和 关 
系 /外 键 。 如 果 存 在 一 个 关于 公司 的 企业 数据 模型 ， 模型 中 确定 了 组 织 使 用 的 所 的 重要 数据 ， 
这 样 可 以 发 现在 任何 局 部 数据 模型 中 都 没有 出 现 的 实体 / 表 和 关系 。 防止 出 现 该 情况 的 方法 为 ， 
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当 与 用 户 讨论 具体 视图 时 ， 让 他 们 特别 注意 是 否 有 存在 于 其 他 视图 的 实体 / 表 和 关系 /外 键 。 否 
则 ， 就 要 检查 每 个 实体 / 表 的 属性 / 列 ， 并 在 其 他 局 部 数据 模型 中 寻找 对 实体 / 表 的 引用 。 你 可 
能 会 发 现在 一 个 局 部 数据 模型 中 的 实体 / 表 的 某 一 个 属性 / 列 对 应 另 一 个 局 部 数据 模型 中 的 实体 / 表 
的 主键 、 备 用 键 、 甚 至 是 非 键 属 性 / 列 。 


* 检查 外 键 
在 这 个 步 又 中 ， 已 经 合并 了 实体 / 表 和 关系 ， 改 变 了 主键 ， 并 且 已 经 标识 了 新 的 关系 。 检 


查 子 表 中 的 外 键 是 否 仍然 是 正确 的 ， 并 且 当 需要 时 作 必 要 的 修改 。StayHome 数 据 库 的 代表 全 
局 逻辑 数据 模型 的 所 有 表 如 图 C-3 所 示 。 






Branch (branchNo, street, city, state, zipCode, mgrStaffNo} 
Primary Key branchNo 

Alkternate Key zipCode 

Foreign Key marStaffNo references Staff(staffNo) 


Member (memberNo, fName, IName, adkiress) 
Priimary Key memberNo 























Registration (branchNo, member NO, staffNo, datefoined)} 
Primary Key branchNo, memberNo Primary Key rentalNo 







ole (catalogNo, actorNo, character) Staff (staffNo, name, position, salary, branchNo, superytsorStafNo} 
Primary Key catalogNo, actorNo Key safNO 
Foucign Key cataiogNo references VideotcatalogNo) Foreign Key branchNo references Branch(branchNo) 
ferences 
erNo, name, address, teHNO status} 
ierNo 







Foreign Xey actarNo references Actor(actorNo} Foreign Key supervisorStaff{No StafHstaffNo) 


Supplier (suppl Teiephone (telNo, branchNo) 
key Primary Key telNo 

A Re Foreign Key branchNo references Branch(branchNo) 

Video (cataiogNo, title, category, dailyRental, Price, directorNo, supplierNo) | VideoForRent(vidcoNo, availabie, CatalogNo, branchNoy 

Primary Key catalogNo Primary Key videoNo 

Foreign Key director No references DirectortdirectorNo) Foreign Key catalogNo references VkieotcatalogNo) 

Forelgn Key supplierNo references Supplier(suppilierNo) Foreign Key branchNo references Branch(branchNo} 

VideoOeder {orderNo, dateOrdered, dateReceived, branchNo) VideoOrderLine (orderNo, catalogNo, quantity} 

Primary Key oederNo Primary Key orderNo, catalogNo 

Forelgn Key banchNo references Branch(branchNo} Foreign Key orderNo references VideoOrdertorderNo} 
Foreign Key catalogNo references Video(catalogNo;} 


图 C-3 StayHome 的 全 局 逻辑 数据 模型 的 表 结构 


“检查 完整 性 约束 和 业务 规则 

检查 全 局 逻辑 数据 模型 中 的 完整 性 约束 和 业务 规则 与 最 初 在 用 户 视图 中 指定 的 约束 是 否 
有 冲突 ， 如 果 标 识 了 任何 新 的 关系 或 者 创建 了 新 的 外 键 ， 则 要 确保 指定 了 适当 的 参照 完整 性 
约束 。 任 何冲 突 都 必须 和 用 户 一 起 协商 解决 。 

“ 画 出 全 局 ER 图 和 表 

现在 可 以 绘制 一 张 最 终 的 代表 所 有 合并 的 局 部 逻辑 数据 模型 的 图 了 。 如 果 是 基于 表 所 作 的 
合并 ， 那 么 我 们 称 最 终 的 结果 图 为 “全 局 表 图 "， 它 列 出 了 主键 和 外 键 。 如 果 是 使 用 局 部 ER 图 
进行 合并 ， 则 结果 图 就 简单 地 称 为 “全 局 ER 图 ”。 StayHome 数 据 库 的 全 局 表 图 如 图 C-4 所 示 。 

“更 新 文档 

更 新 文档 以 反映 全 局 数据 模型 开发 阶段 发 生 的 变化 。 使 文档 保持 最 新 状态 ， 反 映 出 当前 
的 数据 模型 是 很 重要 的 。 如 果 后 来 模型 中 发 生 了 变化 ， 包括 在 数据 库 实 现 阶段 或 是 在 数据 库 
维护 阶段 发 生变 化 ， 文 档 都 应 该 同时 被 更 新 。 过 期 的 信息 在 以 后 会 带 来 相当 大 的 困扰 。 


C.2.2 步骤 2.6.2: 检查 全 局 馆 辑 数据 模型 
目标 

























检查 从 全 局 逻辑 数据 模型 创建 的 表 的 结构 是 否 进行 适当 的 规范 化 ， 并 支持 必需 的 事务 。 
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Supplier 
supplierNo 
1..1 
; irect 
a Directs Director | 
1..1 directorNo 













































Supplies 
Features > Role 大 Plays Actor 
O..* actorNo {PK, FK} 1..* 1..1 actorNo {PK} 
catalogNo {PK, FK} 
一 一 一 一 一 一 一 
Video PartOf VideoOrderLine Comprises VideoOrder 
artOf b> 二 Comp 
catalogNo {PK} 1..1 1..* orderNo {PK, FK} 1..* 1..1 orderNo {PK]} 





branchNo {FK} 





directorNo {FK} catalogNo {PK, FK} 
supplierNo {FK} 









Telephone 


telNo {PK]} Places > 
branchNo {FK} 













二 Supervises 






















VideoForRent IsAllocated Branch 


videoNo [PK} 1..* branchNo {PK} 
branchNo {FK} megrStaffNo {FK} 
catalogNo {FK} 


1..1 1..* 
二 Manages 











staffNo {PK} 
branchNo {FK} 
supervisorStaffNo {FK} 


Supervisor 








IsPartOf | 1..1 Processes 


teaes vena 


rentalNo {PK)} memberNo {PK} 
videoNo I{FK} 








Registration 


memberNo (PK, FK} 
branchNo {PK, FK} 
staffNo {FK} 



















memberNo {FK} 





图 C-4 StayHome 数 据 库 系统 的 全 局 表 图 


在 这 个 步骤 中 ， 用 规范 化 方法 检查 为 全 局 数据 模型 创建 的 表 的 结构 ， 并 检查 这 些 表 是 否 
能 够 支持 所 有 的 用 户 事务 ， 这 些 操作 同 第 10 章 中 步骤 2.2 和 2.3 中 的 操作 一 样 。 但 是 ， 你 只 需要 
检查 在 合并 阶段 模型 发 生变 化 的 部 分 就 可 以 了 。 在 一 个 大 型 系统 中 ， 这 对 于 减少 需要 重新 检 
查 的 工作 量 是 很 重要 的 。 


C.2.3 步骤 2.6.3: 考虑 未 来 的 增长 情况 
有 目标 确定 在 可 预见 的 未 来 是 否 会 有 较 大 的 变化 ， 并 且 估计 全 局 还 辑 数据 模型 是 否 可 


以 容纳 这 些 变化 。 


全 局 逻辑 数据 模型 容易 扩展 是 很 重要 的 。 如 果 模 型 只 能 支持 当前 的 需求 ， 那 么 模型 的 生 
命 期 可 能 就 会 很 得， 并 且 为 了 容纳 新 的 需求 ， 可 能 需要 做 较 多 的 工作 。 创 建 一 个 可 扩展 的 模 
型 是 很 重要 的 ， 同 时 这 个 模型 应 该 可 以 继续 发 展 以 支持 新 的 需求 ， 并 且 对 已 经 存在 的 用 户 的 
影响 比较 小 。 当 然 ， 这 很 难 实现 ， 因 为 企业 并 不 知道 将 来 想 要 做 什么 。 即 使 企业 知道 要 做 什 
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么 ， 为 了 容纳 未 来 可 能 的 增长 ， 在 时 间 和 人 金钱 上 都 要 付出 很 昂贵 的 代价 。 因 此 ， 应 该 有 所 选 
择 地 在 某 些 方面 进行 扩充 。 


C.2.4 步骤 2.6.4: 和 用 户 共同 评审 全 局 逻辑 数据 模型 


目标 确保 全 局 逻辑 数据 模型 确实 是 企业 数据 需求 的 表达 。 


全 局 逻辑 数据 模型 现在 应 该 已 经 是 完整 的 和 准确 的 。 应 该 与 用 户 评审 模型 和 描述 模型 的 
文档 ， 以 确保 它 确实 反映 了 企业 的 数据 需求 。 

现在 你 已 经 准备 从 逻辑 设计 转换 为 物理 设计 了 ， 这 些 内 容 包 含 在 方法 学 的 步骤 3 到 步骤 8 
中 ， 我 们 在 第 12 章 ~ 第 16 章 中 进行 了 介绍 。 


C.3 附录 总 结 


逻辑 数据 库 设计 方法 学 中 的 步骤 2 中 的 2.6 步 是 可 选 的 ， 而 且 只 有 当 创建 一 个 相当 复杂 的 数 
据 库 系统 ， 这 个 复杂 的 数据 库 系 统 可 能 包含 多 个 多 变 的 用 户 视图 ， 并 采用 视图 集成 方法 来 管 
理 时 ， 才 使 用 这 个 步骤 。 
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在 这 个 附录 中 你 将 学 到 : 

。 主 存储 和 辅助 存储 的 区 别 。 

。 文 件 组 织 的 含义 和 访问 方法 。 

。 堆 文件 是 如 何 组 织 的 。 

* 有 序 文件 是 如 何 组 织 的 。 

。 哈 希 文件 是 如 何 组 织 的 。 

“索引 是 什么 以 及 它 是 如 何 用 于 提高 数据 库 检索 速度 的 。 

* 主 索引 、 二 级 索引 和 聚 徐 索引 间 的 区 别 。 

“多 级 索引 是 如 何 组 织 的 。 

*B' 树 是 如 何 组 织 的 。 

*。 位 图 索引 是 如 何 组 织 的 。 

。 连接 索引 是 如 何 组 织 的 。 

*。 如何 选择 合适 的 文件 组 织 。 

“索引 聚 秘 和 哈 希 聚焦 是 如 何 组 织 的 。 

第 13 章 中 介绍 的 物理 数据 库 设计 方法 学 中 的 步骤 4.2 和 4.3 关 心 的 就 是 对 合适 的 文件 组 织 以 
及 对 已 经 创建 好 的 表达 公司 (或 公司 的 一 部 分 ) 的 数据 需求 的 基本 表 的 索引 的 选择 。 在 这 部 
分 附录 中 ， 我 们 介绍 在 辅助 存储 设备 中 的 数据 库 的 物理 存储 的 概念 。 计算 机 的 主 存储 器 ， 即 
主 存 ， 不 适合 于 存储 数据 库 。 尽管 主 存储 器 的 访问 速度 比 辅 存 要 快 得 多 ， 但 是 即使 用 主 存 来 
存储 一 个 基本 的 数据 库 所 需 的 数据 量 ， 其 空间 都 是 不 够 大 而 且 是 不 可 靠 的 。 由 于 主 存 的 数据 
会 随 着 电源 的 断 开 而 丢失 ， 所 以 我 们 认为 主 存 是 不 稳定 的 存储 器 。 相 反 ， 在 辅 存 中 的 数据 即 
使 在 电源 断 开 的 情况 下 也 可 以 保留 ， 因 此 ， 被 认为 是 稳定 的 存储 器 。 此 外 ， 主 存 的 每 个 存储 
单元 的 价格 要 比 磁盘 贵 得 多 。 

在 下 面 的 几 节 中 ， 我 们 介绍 物理 存储 的 基本 概念 以 及 文件 组 织 的 主要 类 型 ， 即 堆 (无 序 
的 )、 顺 序 的 (有 序 ) 和 哈 希 文件 。 在 D.5 节 ， 我 们 讨论 了 索引 是 怎样 被 用 来 提高 数据 库 检索 
性 能 的 ， 特 别 是 考虑 了 多 级 索引 、B-* 树 、 位 图 索引 和 连接 索引 。 这 个 附录 中 的 例子 均 来 自 
6.4.4 节 介绍 的 StayHome 案 例 研究 。 


D.1 基本 概念 


辅 存 中 的 数据 库 被 组 织 成 一 个 或 多 个 文件 ， 每 个 文件 由 一 条 或 多 条 记录 组 成 ， 而 每 条 记 
录 又 由 一 个 或 多 个 字段 组 成 。 典 型 的 情况 是 ， 一 条 记录 对 应 一 个 实体 的 出 现 ， 而 一 个 字段 对 
应 一 个 属性 或 列 。 考虑 从 StayHome 例 子 中 得 到 的 Staff 表 ， 如 图 D-1 所 示 。 

我 们 可 能 希望 表 中 的 任何 一 条 记录 都 映射 到 保存 Staff 表 的 操作 系统 文件 中 的 一 条 记录 ， 
记录 中 的 每 个 字段 被 存储 成 Staff 表 中 的 一 列 。 当 需 要 从 DBMS 中 获取 一 条 记录 时 ， 例 如 员工 
号 为 S0003 的 记录 ， DBMS 将 此 条 逻辑 记录 映射 到 一 个 物理 记录 ， 并 利用 操作 系统 的 文件 访问 
例 程 检索 物理 记录 到 主 存 中 的 DBMS 的 缓冲 区 中 。 
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Manager 
Assistant 
Manager 
Supervisor 
Manager 


Manager 





图 D-1 StayHome 示 例 中 的 Staff 表 


物理 记录 是 磁盘 和 主 存 之 间 的 交换 单元 。 
一 条 逻辑 记录 可 能 只 对 应 一 条 物理 记录 ， 但 对 于 大 的 逻辑 记录 可 以 


依赖 于 逻辑 记录 的 大 小 ， 


一 般 来 说 ， 一 条 物理 记录 由 多 条 逻辑 记录 组 成 ， 


跨越 多 条 物理 记录 。 经 常 使 用 术语 “ 块 ”和 “页 ”来 代替 物理 记录 ， 在 本 附录 的 其 余部 分 我 


们 使 用 术 词 “页 ”。 
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例如 ，、 图 D-1 中 的 Staff 记 录 可 以 存储 在 两 个 页 上 ， 如 图 D-2 所 示 。 


Assistant 1 
Manager 

Supervisor 

Manager 2 
Manager 


图 D-2 Staff 表 在 页 中 的 存储 
数据 记录 在 文件 中 存储 和 存 取 的 顺序 依赖 于 文件 的 组 织 。 


文件 组 织 (File Organization ) 
文件 组 织 的 主要 类 型 有 : 





当 文件 存储 在 磁盘 上 时 在 文件 中 安排 记录 的 顺序 。 





“ 堆 (无 序 ) 文件 : 记录 在 磁盘 中 的 存储 没有 特定 顺序 。 
“有 序 (排序 的 ) 文件 : 记录 是 按照 指定 字段 的 值 排序 的 。 
* 哈 希 文件 : 记录 是 根据 哈 希 函数 的 值 在 磁盘 中 存储 的 。 





对 应 每 一 种 文件 组 织 方式 ， 都 有 一 组 存 取 方 法 。 


存 取 方法 (Access Method) ”该 步骤 涉及 从 文件 中 存储 和 检索 记录 。 


由 于 某 些 存 取 方 法 只 能 用 在 某 一 种 文件 组 织 中 (例如 ， 我 们 不 能 对 一 个 没有 索引 的 文件 
使 用 索引 存 取 方 法 )， 所 以 文件 组 织 和 存 取 方 法 这 两 个 术语 是 可 以 交替 使 用 的 。 在 这 个 附录 的 
后 续 部 分 ， 我 们 将 讨论 文件 组 织 的 主要 类 型 ， 并 提供 了 选择 合适 的 索引 和 文件 组 织 的 方针 。 


D.2 堆 文 件 


一 种 无 序 的 文件 ， 有 时 称 为 堆 文件 ， 是 最 简单 的 文件 组 织 方式 。 记 录 按 照 它 们 插入 的 顺 
序 放置 在 文件 中 。 一 条 新 记录 被 插入 到 文件 的 最 后 一 页 ， 如 果 最 后 一 一 页 没有 多 余 的 空间 ， 那 
么 就 在 文件 中 添加 一 个 新 页 。 这 对 插入 操作 是 非常 有 效 的 。 然 而 ， 由 于 堆 文 件 中 没有 根据 某 
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一 字段 的 值 排 出 特定 顺序 ， 因 此 存 取 一 条 记录 必须 要 使 用 线性 查找 。 线 性 查找 包括 从 文件 中 
读 出 页 一 直到 找到 所 需 的 记录 为 止 。 这 就 使 得 从 包含 许多 页 的 堆 文 件 中 进行 检索 的 速度 相对 
来 说 比较 慢 ， 除 非 这 个 检索 包括 文件 中 所 有 记录 的 大 部 分 。 

要 删除 一 条 记录 ， 首 先 需要 检索 出 所 需 的 页 ， 然 后 将 这 条 记录 标记 上 已 删除 标记 ， 并 把 
页 写 回 到 磁盘 。 被 删除 的 记录 的 空间 是 不 可 再 用 的 。 因 此 ， 随 着 删除 动作 的 发 生 ， 系 统 的 性 
能 也 日 益 恶 化 了 。 这 就 意味 着 ， 堆 文件 需要 数据 库 管理 员 (DBA) 定期 地 对 文件 进行 重组 织 ， 
收回 那些 被 删除 记录 的 未 使 用 空间 。 

对 于 向 表 中 插入 大 批量 数据 的 操作 ， 堆 文件 是 最 好 的 文件 组 织 方式 之 一 ， 因 为 记录 被 顺 
序 地 插入 到 文件 的 末尾 。 那 样 不 会 在 计算 记录 要 插入 哪 一 页 时 产生 额外 消耗 。 


D.3 有 序 文件 


文件 中 的 记录 可 以 根据 一 个 或 多 个 字段 的 值 来 排序 ， 组 成 一 个 按键 值 排序 的 数据 集 ， 被 
用 来 对 文件 进行 排序 的 字段 称 为 排序 字段 (ordering field)。 如 果 排 序 字段 也 正好 是 文件 的 主 
键 ， 那 么 也 就 保证 了 在 每 条 记录 中 都 有 唯一 的 值 ， 这 个 字段 也 被 称 为 文件 的 排序 字段 。 例 如 ， 
考虑 下 面 的 SQL 查询 语句 : 

SELECT * 


FROM Staff 
ORDER BY staffNo; 


如 果 Staff 表 中 的 记录 已 经 根据 有 序列 staffNo 的 值 排 序 了 ， 那 么 就 有 可 能 减少 查询 的 执行 
时 间 ， 因 为 没有 必要 再 排序 了 。 


注意 尽管 在 2.2 节 中 我 们 说 明了 关系 模型 的 记录 是 无 序 的， 但 这 个 是 指 由 外 部 的 ( 膛 
辑 的 ) 性 质 ， 而 不 是 可 执行 的 (物理 的 ) 的 性 质 。 物 理 上 总 是 第 一 条 记录 、 第 二 条 记 
录 、 一 直到 第 n 条 记录 。 


如 果 记 录 是 按照 staffNo 来 排序 的 ， 在 某 些 情况 下 ， 我 们 可 以 使 用 二 分 查找 法 来 执行 基于 
staffNo 查 询 条 件 的 查询 ， 例 如 ， 考 虑 下 面 的 SQL 查 询 语句 : 

SELECT * 

FROM Staff 

WHERE staffNo = 'S1500'; 

如 果 我 们 使 用 图 D-1 中 显示 的 数据 并 且 假 定 每 一 页 上 只 有 一 条 记录 ， 就 会 得 到 如 图 D-3 所 
示 的 排 好 序 的 结果 。 二 分 查找 的 过 程 如 下 : 

1) 检索 文件 的 中 间 页 。 检 查 所 需 的 记录 是 否 在 这 一 页 的 第 一 条 记录 和 最 后 一 条 记录 之 间 。 
如 果 是 ， 则 不 需要 再 检索 其 他 的 数据 页 了 。 

2) 如 果 这 一 页 的 第 一 条 记录 的 主键 值 比 所 需 的 记录 的 主键 值 大 ， 则 所 需 记录 (如 果 存 
在 的 话 ) 必然 在 前 面 的 数据 页 中 。 因 此 ， 我 们 重复 上 面 的 步骤 ， 从 文件 前 面 的 中 间 一 页 开 
始 检 索 。 

3) 如 果 这 一 页 的 最 后 一 条 记录 的 主键 值 比 所 需 的 记录 的 主键 值 小 ， 则 所 需 记 录 必 然 在 后 
面 的 数据 页 中 。 因 此 ， 我 们 重复 上 面 的 步 又 ， 从 文件 后 面 的 中 间 一 页 开始 检索 。 这 样 ， 检 索 
的 数据 页 中 的 一 半 的 查询 空间 都 被 消除 了 。 
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图 D-3 在 有 序 的 Staff 文 件 中 的 二 分 检索 


在 我 们 的 例子 中 ， 中 间 页 是 第 3 页 ， 检 索 页 上 的 记录 的 主键 值 (S0415) 不 等 于 所 需 的 记 
录 的 主键 值 (S1500)。 第 3 页 的 主键 值 比 所 需 的 记录 的 主键 值 要 小 ， 因 此 ， 我 们 就 可 以 从 检索 
中 省 略 掉 文件 的 前 一 半 页 面 。 现 在 我 们 检索 后 面 的 页 面 的 中 间 页 ， 也 就 是 第 5 页 。 这 一 次 主键 
的 值 (S2250) 比 S1500 大 ， 这 样 我 们 又 可 以 省 掉 了 这 次 查找 空间 的 后 一 半 。 我 们 现在 检索 剩 
余 空间 的 中 间 页 (第 4 页 )， 就 是 我 们 所 需要 的 记录 。 

一 般 来 说 ， 二 分 查找 比 线性 查找 更 有 效率 。 但 是 ， 二 分 查找 多 用 于 主 存 中 数据 的 检索 ， 
而 对 辅 存 中 的 数据 使 用 的 就 比较 少 了 。 

在 一 个 有 序 的 文件 中 插入 和 删除 记录 是 一 件 很 麻烦 的 事情 ， 因 为 要 保持 记录 的 有 序 性 。 
要 插入 一 条 新 记录 ， 我 们 必须 按照 顺序 找到 合适 的 插入 位 置 ， 并 且 要 找到 插入 的 空间 。 如 果 
在 找到 的 页 面 中 有 足够 的 空间 可 以 插入 新 记录 ， 那 么 这 一 页 就 可 以 重新 排序 并 且 写 回 到 磁盘 
中 。 如 果 不 是 ， 那 么 就 有 必要 移动 一 条 或 多 条 记录 到 下 一 个 页 面 中 。 同 样 ， 如果 下 一 个 页 面 
也 没有 多 余 的 空间 ， 那 么 就 需要 将 记录 再 移动 到 下 一 个 页 面 中 ， 依 次 类 推 。 

在 一 个 大 的 文件 的 接近 开始 的 位 置 插入 一 条 记录 可 能 是 一 项 非常 费时 的 工作 。 一 种 解决 
办 法 是 建立 一 个 临时 的 无 序 文件 ， 叫 做 溢出 文件 。 将 插入 的 记录 加 到 溢出 文件 中 ， 而且， 定 
期 将 溢出 文件 写 到 主 文件 中 去 。 这 虽然 使 得 插入 工作 非常 有 效率 ， 但 是 在 查询 上 却 产生 了 不 
好 的 影响 。 如 果 用 二 分 查找 没有 找到 所 需 的 记录 ， 就 必须 用 线性 查找 在 溢出 文件 中 进行 查找 
了 。 相 反 的 ， 要 删除 一 条 记录 ， 必 须 确认 记录 被 移动 到 有 效 的 位 置 。 

除非 文件 中 有 一 个 主 索引 ， 否 则 有 序 文件 很 少 用 在 数据 库存 储 中 (参考 D.5.1 节 )。 


D.4 哈 希 文件 


在 一 个 哈 希 文件 中 ， 记 录 不 必 按 照 顺序 写 到 文件 中 。 取 而 代 之 的 是 ， 哈 希 函 数 根据 一 个 
或 多 个 字段 的 值 计 算出 记录 要 存储 在 页 面 中 的 位 置 。 所 依据 的 字段 叫做 哈 希 字段 ， 或 着 ， 如 
果 这 个 字段 恰好 是 文件 的 主键 ， 则 它 就 被 称 为 哈 希 主键 。 哈 希 文件 中 的 记录 是 随机 地 分 布 在 
文件 的 有 效 空间 中 的 。 因 此 ， 哈 希 文件 有 时 被 称 为 随机 文件 或 直接 文件 。 

哈 希 函数 的 使 用 使 得 记录 尽 可 能 分 散在 文件 中 的 各 部 分 。 其 中 有 一 种 哈 希 函数 ， 叫 做 除 
留 余数 法 ， 此 种 方法 使 用 MOD ( 取 模 ) 函数 ， 取 出 要 使 用 的 字段 的 值 除 以 预先 确定 好 的 一 个 
整 型 除数 ， 用 余数 作为 磁盘 的 地 址 。 

大 多 数 哈 希 函数 存在 的 问题 是 它们 都 不 能 保证 一 个 唯一 的 地 址 ， 因 为 哈 希 字段 可 能 取 到 
的 值 的 数量 基本 上 比 记录 的 有 效 地 址 的 数量 大 得 多 。 哈 希 函 数 产生 的 每 个 地 址 对 应 于 一 个 页 ， 
或 者 一 个 桶 (Bucket)， 桶 用 于 存放 多 条 记录 。 在 一 个 桶 中 ， 记 录 按 照 到 达 的 顺序 存放 。 当 两 
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条 或 多 条 记录 的 地 址 相同 时 ， 就 发 生 了 冲突 。 在 这 种 情况 下 ， 由 于 它 的 哈 希 地址 被 占用 了 ， 
因此 我 们 必须 把 新 的 记录 插 人 到 其 他 的 位 置 。 解 决 冲突 问题 使 得 哈 希 文件 的 管理 被 复杂 化 了 ， 
而 且 也 降低 了 整体 的 性 能 。 

D.5 索引 


在 这 部 分 中 ,我 们 讨论 利用 索引 来 提高 数据 查询 效率 的 技术 。 





索引 (Index) 一 种 数据 结构 。 使 用 DBMS 快 速 地 在 文件 中 查找 记录 ， 并 能 快速 响应 
用 户 的 查询 。 





数据 库 中 的 索引 类 似 于 书 的 目录 。 它 是 与 要 查找 信息 的 文件 相关 联 的 一 个 辅助 结构 ， 就 
像 查找 书 的 目录 一 样 ， 先 找到 一 个 关键 词 然 后 找到 这 个 关键 词 所 在 的 一 个 或 多 个 页 的 列表 。 
索引 的 存在 使 得 我 们 不 必 在 每 次 寻找 一 项 的 时 候 都 要 浏览 整个 文件 。 在 存在 数据 库 索 引 的 情 
况 下 ， 所 需要 的 项 将 是 文件 中 的 一 条 或 多 条 记录 。 与 书 的 目录 类 似 ， 索引 也 是 有 序 的 ， 并 且 
每 个 索引 项 都 包含 所 需要 的 项 和 一 个 或 多 个 这 些 项 能 够 被 找到 的 位 置 (记录 标识 )。 

虽然 索引 在 数据 库 管 理 系 统 中 不 是 必需 的 ， 但 是 它们 对 性 能 有 很 重要 的 影响 。 就 像 使 用 
书 的 目录 一 样 ， 虽 然 我 们 能 够 通过 浏览 整 本 书 找到 需要 的 关键 词 ， 但 是 这 样 做 将 是 单调 而 费 
时 的 。 在 书后 有 一 个 按 字母 顺序 排列 的 索引 能 够 使 我 们 直接 找到 我 们 想 要 的 页 。 

一 个 索引 结构 是 与 一 个 特定 的 查询 关键 字 相关 的 ， 并 且 包 含 由 关键 字 值 和 包含 这 个 值 的 
逻辑 记录 组 成 的 记录 。 包 含 逻 辑 记 录 的 文件 称 为 数据 文件 ， 而 含有 索引 记录 的 文件 称 为 索引 
文件 。 索 引文 件 中 的 值 是 根据 索引 字段 的 值 来 排序 的 ， 这 个 索引 字段 通常 是 基于 表 中 的 某 个 
列 的 。 


D.5.1 索引 的 类 型 


有 不 同 种 类 型 的 索引 ， 主 要 包括 : 

“ 主 索引 “数据 文件 根据 一 个 有 序 的 键 字段 顺序 排序 (参见 D.3 节 )， 并 且 索 引 字 段 是 建立 

在 有 序 的 键 字 段 上 的 。 键 字段 是 保证 每 条 记录 都 有 唯一 的 值 。 

“ 育 簇 索引 “数据 文件 根据 非 键 字 段 的 值 来 顺序 排序 ， 并 且 索 引 字 段 是 建立 在 这 些 非 键 字 

段 上 的 ， 因 此 对 应 索引 字段 的 一 个 值 可 能 会 有 多 条 记录 。 非 键 字 段 被 称 为 聚 禾 字 段 。 

“二 级 索引 定义 在 一 个 数据 文件 中 的 非 排序 字段 上 的 索引 。 

一 个 文件 最 多 只 能 有 一 个 主 索引 或 一 个 聚 簇 索引 ， 但 可 以 有 多 个 二 级 索引 。 另 外 ， 一 个 
索引 可 能 是 稀疏 的 或 密集 的 : 稀疏 索引 只 为 文件 中 的 某 一 些 查询 键 值 建立 了 索引 记录 : 密集 
索引 为 文件 中 的 每 一 个 查询 键 值 建 立 了 索引 记录 。 

一 个 索引 的 查询 关键 字 可 以 包含 多 个 字段 。 图 D-4 考 虑 了 Staff 表 中 的 四 个 密集 索引 : 一 个 
基于 salary 列 ， 一 个 基于 branchNo 列 ， 一 个 基于 复合 索引 (salary、branchNo)， 最 后 一 个 基于 
复合 索引 (branchNo、salary ) 。 


D.5.2 二 级 索引 


一 级 索引 也 是 像 主 索引 一 样 的 有 序 文件 。 但 是 ， 与 主 索引 相关 的 数据 文件 是 根据 索引 关 
键 字 的 值 排序 的 ， 而 与 二 级 索引 相关 的 数据 文件 也 许 不 是 按照 索引 关键 字 的 值 进行 排序 的 。 
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b) (branchNo、 salary) 和 branchNo 
图 D-4 Staff 表 上 的 索引 


此 外 ， 同 主 索 引 不 同 ， 二 级 索引 字段 不 需要 唯一 的 值 。 例 如 ， 我 们 可 能 希望 建立 一 个 基于 staff 
表 的 branchNo 字 有 段 的 二 级 索引 。 从 图 D-1 我 们 可 以 看 到 字段 branchNo 列 的 值 并 不 是 唯一 的 。 

二 级 索引 提高 了 使 用 非 主 索 引 字段 的 字段 进行 查询 的 性 能 。 然 而 ， 查 询 的 性 能 的 改进 也 
要 平衡 数据 更 新 时 对 索引 进行 维护 的 费用 。 这 是 第 13 章 讨论 的 物理 数据 库 设计 的 内 容 。 


D.5.3 多 级 索引 


再 次 考虑 Staff 表 ， 这 一 次 用 salary 列 来 排序 ， 要 查询 “工资 在 $32000 到 $45000 之 间 的 所 有 
员工 的 信息 ”。 我 们 已 经 注意 到 如 果 文 件 是 有 序 的 , 我 们 就 可 以 执行 二 分 查找 找到 第 一 条 记录 ，， 
然后 从 这 点 开始 顺序 查找 其 余 的 满足 条 件 的 记录 。 但 是 ， 如 果 Staff 文 件 很 大 ， 则 初始 的 二 分 
查找 就 会 相当 慢 。 : 

克服 这 个 问题 的 一 种 方法 是 创建 一 个 基于 salary 列 的 索引 ， 如 果 此 索引 包含 数据 文件 中 每 
个 页 的 salary 列 的 第 一 个 值 的 入 口 ， 则 我 们 就 可 以 在 索引 文件 上 实现 二 分 查找 ， 找 到 包含 第 一 
个 工资 值 大 于 $32000 的 数据 页 。 

然而 ， 当 索引 文件 逐渐 扩大 到 多 个 页 的 时 候 ， 对 所 需 索 引 的 查找 时 间 就 增加 了 。 多 级 索引 
试图 通过 减少 查找 范围 来 克服 这 个 问题 。 也 就 是 像 对 待 其 他 任何 文件 一 样 看 待 索 引 ， 将 索引 分 
成 小 索引 并 且 再 为 这 些小 索引 建立 索引 。 图 D-5 显 示 了 图 D-1 所 示 的 Staff 表 的 二 级 索引 (稀疏 的 ) 
的 例子 。 数 据 文件 的 每 一 页 能 够 存储 两 条 记录 。 作 为 示例 ， 尽 管 在 实际 情况 当中 每 一 个 数据 页 
中 可 以 有 多 条 索引 记录 ， 但 是 我 们 这 里 只 显示 了 每 一 页 中 只 有 两 条 索引 记录 。 每 个 索引 记录 保 
存 一 个 访问 关键 字 (salary) 和 一 个 页 地 址 。 存 储 的 访问 关键 字 的 值 对 应 的 是 存储 地 址 的 页 上 的 
第 一 条 记录 。 

要 查找 我 们 所 需要 记录 的 地 址 ， 从 第 二 级 索引 开始 查找 其 最 后 的 访问 关键 字 的 值 小 于 或 
等 于 32000 的 页 ， 在 我 们 例子 中 是 30000。 这 一 条 索引 记录 包括 一 个 指向 第 一 级 索引 页 的 地 址 ， 
用 这 个 地 址 继续 查找 。 重 复 上 面 的 过 程 将 到 达 数 据 文件 中 存储 有 第 一 条 记录 的 第 一 页 。 我 们 
现在 连续 地 读 取 数 据 文件 就 能 找到 其 余 的 符合 条 件 的 记录 。 

IBM 的 索引 顺序 存 取 方法 (Indexed Sequential Access Method, ISAM) 就 是 基于 两 级 索 
引 的 结构 。 其 插入 操作 是 用 溢出 文件 来 处 理 的 ， 如 D.3 节 所 介绍 。 通 常 来 说 ， 尽管 三 级 索引 在 
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实际 当中 是 很 普遍 的 ， 但 也 可 以 建立 n 级 索引 。 但 当 多 于 三 级 索引 时 ， 文 件 将 会 很 大 。 在 接 下 
来 的 几 节 中 ， 我 们 将 讨论 一 种 特殊 类 型 的 多 级 密集 索引 ， 称 为 B 树 。 


2 级 索引 1 级 索引 数据 文件 页 
ct 
S3250 Robert Chin Supervisor 32000 | B002 
000 [7 : 
oo | © 


[30000 | @ S0415 Art Peters Snr Assistant | 41000 B003 2 
48000 | @J S1500 Tom Daniels Manager 46000 | BOO1 
00 | oJ 
| | | S2250 Sally Stern Manager 48000 | 8B004 3 
S0010 Mary Martinez | Manager 50000 | B002 


图 D-5 多 级 索引 示例 


D.5.4 B’ 树 


ISAM 主 要 的 缺点 是 当 数 据 库 增 大 时 ， 由 于 溢出 文件 而 使 得 数据 库 性 能 恶化 了 ， 因 此 DBA 
需要 定期 对 索引 进行 重新 组 织 。 重 新 组 织 索 引 不 但 很 费时 ， 而 且 在 重新 组 织 过 程 中 文件 是 不 
可 用 的 。B* 树 结构 通过 溢出 发 生 时 的 分 裂 节点 解决 了 这 个 问题 。 

B' 树 是 一 种 特殊 类 型 的 多 级 索引 ， 在 B' 树 中 任何 一 条 树 的 顶层 ( 称 为 根 节点 ) 到 底层 
( 称 为 叶 节 点 ) 的 层 数 都 是 相同 的 ， 也 就 是 说 ， 这 个 树 是 平衡 的 。 叶 节点 包含 有 指向 表 中 记录 
的 指针 ， 而 不 是 记录 本 身 。 

通过 确保 查找 相同 数目 的 节点 ， 在 B" 树 中 查找 任何 数据 记录 总 是 需要 大 致 相同 的 时 间 、 
因为 通过 的 节点 个 数 相 同 ， 也 就 是 说 ， 要 保证 树 的 深度 是 不 变 的 。 由 于 B-* 树 是 一 个 密集 索引 ， 
所 以 每 条 记录 都 有 索引 来 指向 ， 这 样 就 没有 必要 为 数据 文件 进行 排序 了 。 但 是 ， 当 更 新 树 的 
内 容 时 ， 维 护 索 引 的 代价 是 很 昂贵 的 。 | 

实际 上 ， 树 中 的 每 个 节点 都 是 一 页 ， 因 此 我 们 通常 在 同一 页 上 存储 几 个 关键 字 的 值 。 例 
如 ， 如 果 我 们 假设 一 页 有 4096 字 节 ， 而 关键 字 字段 和 它 相应 的 指针 需要 4 个 存储 字 节 存 储 ， 而 
且 每 个 页 需要 4 字 节 来 指向 同 层 中 的 下 一 节点 ， 那 么 ， 每 一 页 能 存储 (4096-4) / (4+4) =511 
个 索引 记录 。 根 节点 能 存储 511 条 记录 也 就 有 512 个 分 支 。 每 个 子 节点 也 可 以 存储 511 条 记录 ， 
这 样 总 共 可 以 有 261632 条 记录 。 每 个 子 节点 也 能 再 有 512 个 子 节点 ， 因 此 ， 在 树 的 第 二 级 就 共 
有 262144 个 子 节点 。 每 个 这 样 的 子 节点 可 以 有 511 个 记录 ， 总 共 133955584 个 。 这 就 给 出 了 理 
论 上 的 索引 记录 的 最 大 数 : 

一 


根 511 

一 和 261632 
二 级 133955584 
总 数 134217727 


| 

这 样 ， 我 们 就 可 以 随机 地 向 一 个 包含 有 134217727 条 记录 ， 有 4 个 磁盘 存 取 入 口 (实际 上 ， 
根 节 点 一 般 存 放 在 主 存 中 ， 因 此 也 就 少 了 一 个 磁盘 存 取 入 口 ) 的 文件 中 存 取 一 条 记录 。 实 际 
上 ,每 一 页 中 存储 的 记录 数 并 没有 理论 数目 那么 多 。 
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D.5.5 位 图 索引 


另 一 种 类 型 的 索引 也 变 得 日 益 普及 ， 特 别 是 在 数据 仓库 中 ， 它 就 是 位 图 索引 。 位 图 索引 
通常 用 在 有 稀疏 域 ( 即 ， 这 个 域 具 有 有 限 数量 的 值 ) 的 列 上 。 与 为 列 存储 实际 的 值 不 同 ， 位 
图 索引 只 为 每 个 列 存储 一 个 位 向 量 (bit vector) ， 用 于 表明 哪个 记录 包含 这 个 特定 的 域 值 。 位 
图 中 与 一 个 行 标识 符 对 应 的 每 一 位 被 置 为 1。 如 果 域 值 的 范围 比较 小 ， 则 利用 位 图 索引 是 非常 
节省 空间 的 。 

例如 ， 考 虑 图 D-6a 所 示 的 Video 表 。 假 设 category 列 只 有 如 下 上 几 个 值 : Action、Children、 
Fantasy 和 Sci-Fi， 同 时 假设 dailyRental 列 只 取 下 述 值 中 的 一 个 : $4.00、$4.50 和 $5.00， 我 们 可 
以 构造 位 图 索引 来 表达 这 两 个 列 ， 如 图 D-6b 所 示 。 










Action 
Children 


207132 
902355 
330553 
781132 
445624 
634817 


Die Another Day 














Harry Potter 

Lord of the Rings 
Shrek 
Men in Black 1 










Fantasy 
Children 
Action 
Sci-Fi 




















Independence Day 





图 D-6 a) Video 表 ; b) category 和 dailyRental 列 上 的 位 图 索引 


位 图 索引 提供 了 两 个 优 于 B' 树 索引 的 优点 。 首 先 ， 位 图 索引 比 B' 树 索引 更 紧 资 ， 因 此 比 
B 树 索引 需要 的 空间 要 少 ， 位 图 索引 本 身 也 成 为 一 种 压缩 技术 : 第 二 ， 当 查询 包括 多 个 谓词 
并 且 每 个 都 有 子 句 的 位 图 索引 时 ， 位 图 索引 可 以 极 大 地 提高 性 能 。 例 如 ， 考 虑 如 下 查询 : 


SELECT catalogNo, title 
FROM Video 
WHERE category = 'Fantasy' AND dailyRental = 5.00; 


在 这 个 例子 中 ， 我 们 可 以 为 category 使 用 第 三 个 位 向 量 并 用 dailyRental 的 第 三 个 位 向 量 进 
行 AND 钦 辑 运算 ,来 获得 属于 Fantasy 类 录像 且 日 租金 为 $5.00 的 位 均 为 1 的 位 向 量 。 


D.5.6 连接 索引 


男 一 种 类 型 的 索引 也 在 日 益 普及 ， 它 同样 也 特别 适用 于 数据 仓库 领域 ， 它 就 是 连接 索引 
(join index )。 连 接 索 引 是 在 来 自 两 个 或 多 个 表 (这 些 表 具 有 相同 域 ) 的 列 上 建立 索引 。 例 如 ， 
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考虑 图 D-7a 所 示 的 扩展 的 Branch 表 和 Member 表 ， 我 们 可 以 在 非 键 列 city 上 创建 一 个 连接 索引 ， 
产生 的 索引 表 如 图 D-7b 所 示 。 我 们 选择 在 BranchRowID 上 排序 连接 索引 ， 但 实际 上 可 以 在 这 
三 个 列 中 的 任何 一 个 列 上 进行 排序 。 有 时 也 可 以 创建 两 个 连接 索引 ， 一 个 如 图 所 示 ， 男 一 个 
用 两 个 rowID 列 。 


8 jefferson Way Portland 
City Center Plaza Seattle 

14 - 8th Avenue New York 
16 - 14th Avenue Seattle 


M250178 57 ~ 11th Avenue Seattle 
M166884 89 Redmond Rd Portland 
M115656 Parker 22 W. Capital Way Portland 
M284354 Nelson 123 Suffolk Lane Seattle 





Portland 
Portland 
Seattle 
Seattle 


Seattle 
Seattle 





b) 


图 D-7 a) Branch 表 和 Member 表 ; b) 在 非 键 列 city 上 的 连接 索引 


D.6 选择 文件 组 织 方式 指南 


为 了 更 彻底 地 理解 文件 组 织 方式 ， 在 本 节 中 我 们 提出 了 基于 下 述 文件 类 型 选择 文件 组 织 
方式 的 指南 。 

。 堆 

。 哈 希 

"索引 顺序 访问 方法 (ISAM) 

。B* 树 : 
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1. 堆 (无 序 的 ) 

堆 在 下 述 情况 下 是 一 种 很 好 的 存储 结构 : 

1) 当 数 据 被 批量 加 载 到 表 中 时 。 例如， 你 可 能 希望 在 创建 表 之 后 在 表 中 插入 一 批 记录 。 
如 果 选 择 堆 作 为 初始 的 文件 组 织 方 式 ， 那 么 在 完成 了 插入 操作 后 对 文件 重组 可 能 会 更 有 
效 。 

2) 表 只 有 几 个 数据 页 大 小 。 在 这 种 情况 下 ， 找 到 任何 记录 的 时 间 都 是 很 短 的 ， 即 使 需要 
对 整个 表 进行 顺序 查找 。 

3) 每 当 访 问 表 时 都 需要 检索 表 中 的 每 条 记录 (以 任何 顺序 )。 例 如 ， 检 索 StayHome 中 的 
所 有 会 员 的 地 址 。 

4) 当 表 有 附加 的 访问 结构 时 ， 例 如 索引 键 ， 则 可 以 使 用 堆 存 储 来 节省 空间 。 

当 只 访问 一 个 表 中 被 选 定 的 记录 时 ， 堆 文件 是 不 合适 的 。 

2. 哈 硕 

当 检索 是 基于 与 哈 希 字段 值 精确 匹配 的 记录 时 ， 哈 希 是 一 个 很 好 的 存储 结构 ， 特 别 是 当 
访问 顺序 是 随机 的 时 候 。 例 如 ， 如 果 在 Member 表 的 memberNo 列 上 进行 哈 希 ， 则 检索 
memberNo 等 于 M250178 的 记录 就 非常 有 效 。 但 哈 希 在 下 述 情 况 下 就 不 是 一 个 好 的 存储 结构 : 

1) 当 对 记录 的 检索 是 基于 哈 希 字段 值 的 模式 匹配 时 。 例 如 ， 检 索 会 员 号 (memberNo) 以 
“M2” 开 始 的 所 有 会 员 。 

2) 当 对 记录 的 检索 是 基于 哈 希 字段 值 的 一 个 范围 时 。 例 如 ， 检 索 会 员 号 在 “M200000” 
和 “M200100” 之 间 的 所 有 会 员 。 

3) 当 对 记录 的 检索 是 基于 列 而 不 是 基于 哈 希 列 时 。 例 如 ， 如 果 Member 表 在 memberNo 列 
上 进行 哈 希 ， 则 当 基于 HName 列 检索 记录 时 这 个 哈 希 就 不 能 使 用 。 在 这 种 情况 下 ， 就 需要 执行 
一 个 线性 查找 来 检索 记录 ， 或 者 将 IName 作 为 一 个 二 级 索引 。 

4) 当 记录 的 检索 是 基于 哈 希 的 部 分 字段 时 。 例 如 ， 如 果 Role 表 在 catalogNo 和 catorNo 列 上 
进行 哈 希 ， 则 当 只 基于 catalogNo 列 查找 记录 时 这 个 哈 希 就 不 能 使 用 。 同 样 ， 它 也 需要 执行 一 
个 线性 查找 来 检索 记录 。 

5) 当 哈 希 列 经 常 被 更 新 时 。 当 更 新 一 个 哈 希 列 时 ，DBMS 必 须 删除 整个 记录 并 将 它 重新 
定位 到 新 的 地 址 (如果 哈 希 函数 产生 了 一 个 新 的 地 址 )。 因 此 ， 经 常 更 新 哈 希 列 会 影响 性 能 。. 

3. 索引 顺序 访问 方法 (ISAM) 

ISAM 是 一 个 比 哈 希 更 灵活 的 存储 结构 ， 它 支持 基于 准确 键 匹配 的 检索 、 基 于 模式 匹配 的 检 
索 、 基 于 范围 值 和 部 分 键 规格 说 明 的 检索 。 但 是 ，ISAM 索 引 是 静态 的 ， 它 在 文件 被 创建 时 创建 ， 
因此 ， 你 会 发 现 随 着 表 的 不 断 修改 ，ISAM 文 件 的 性 能 会 恶化 。 更 新 也 引起 ISAM 文 件 丢 失 访 问 键 
的 顺序 ， 因 此 按 访问 键 顺序 进行 检索 将 变 得 很 慢 。 这 两 个 问题 已 经 被 B' 树 文件 组 织 方式 克服 了 。 

4.B' 树 - 

同样 ，B' 树 也 是 一 个 比 哈 希 更 灵活 的 存储 结构 。 它 支持 基于 精确 键 匹 配 、 模式 匹配 、 范 
围 值 和 部 分 键 匹配 的 检索 。B' 树 索引 是 动态 的 ， 随 着 表 的 增长 而 增长 。 因 此 ， 与 1SAM 不 同 ， 
B' 树 文件 的 性 能 不 会 随 着 文件 的 修改 而 恶化 。 即 使 在 文件 被 修改 时 ， B' 树 也 维护 访问 键 的 顺 
序 ， 因 此 按 访 问 键 的 顺序 检索 记录 比 ISAM 更 有 效 。 但 如 果 表 不 经 常 被 修改 ， 则 ISAM 结 构 可 
能 会 更 有 效 ， 因 为 它 比 B* 树 的 索引 级 别 低 ， B 树 的 叶 结 点 包含 指向 表 中 的 实际 记录 的 指针 ， 
而 不 是 实际 的 记录 本 身 。 


一 


D.7 聚 簇 和 非 聚 簇 的 表 


有 些 DBMS (比如 Oracle ) 支持 聚 符 和 非 聚 乌 的 表 。 使 用 聚 镁 的 表 还 是 使 用 非 聚 徐 的 表 依 
赖 于 前 边 对 事务 的 分 析 ， 但 这 个 选择 会 对 性 能 有 影响 。 在 这 一 节 中 ， 我 们 简单 介绍 这 两 种 类 
型 的 结构 并 给 出 使 用 聚 簇 表 的 指南 。 

聚 徐 是 物理 地 存储 在 一 起 的 一 个 或 多 个 表 的 组 ， 它们 共享 相同 的 列 并 且 经 常 被 同时 使 用 。 
利用 物理 地 存储 在 一 起 的 相关 记录 ， 就 可 以 减少 磁盘 访问 时 间 。 在 聚 答 中 的 表 的 相关 列 被 称 
为 聚 得 键 (cluster key ) 。 聚 徐 键 仅 被 存储 一 次 ， 因此 表 的 聚 得 存储 比分 别 存储 (不 聚 答 ) 要 
更 有 效 。 

图 D-8 说 明了 当 我 们 基于 branchNo 列 聚 秘 表 时 ，Branch 和 Staff 表 的 存储 情况 。 当 这 两 个 表 
被 聚 簇 时 ， 每 个 不 同 的 branchNo 列 的 值 只 被 存储 一 次 。 每 个 branchNo 值 被 附加 在 这 两 个 表 的 
列 上 。 
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Ce i di ee Staff 表 
Branch 表 





聚 禾 键 
图 D-8 Branch 和 Staff 表 如 何在 branchNo 上 聚 徐 存储 


正如 我 们 现在 讨论 的 ，Oracle 支 持 两 种 类 型 的 聚 复 : 索引 聚 徐 和 哈 希 聚 禾 。 
D.7.1 索引 聚 簇 


在 索引 聚 锻 中 ， 有 相同 聚 得 键 的 记录 存储 在 一 起 。Oracle 建 议 在 下 述 情 况 下 使 用 索引 聚 和 位: 

。 检 索 聚 徐 键 值 在 一 个 范围 内 的 记录 。 

。 聚 振 的 表 可 能 会 不 可 预料 地 增长 。 

聚 钴 可 以 提高 数据 检索 的 性 能 ， 这 依赖 于 数据 的 分 布 和 在 数据 上 经 常 使 用 的 SQL 操作 。 
特别 地 ， 在 一 个 查询 中 连接 的 表 适 合 使 用 聚 往 ， 因 为 对 连接 表 中 的 相同 记录 的 检索 有 相同 的 
LO 操作 。 

要 在 Oracle 中 创建 一 个 聚 徐 键 列 为 branchNo、 名 字 为 BranchIndexedCluster 的 索引 聚 簇 ， 
可 以 使 用 如 下 SQL 语 铝 : 

CREATE CLUSTER BranchIindexedCluster 

(branchNo CHAR(4)) 

SIEZE 512 

STORAGE (INITIAL 100K NEXT 50K PCTINCREASE 10); 

SIZE 参 数 指定 存储 所 有 具有 相同 聚 徐 键 值 的 记录 的 空间 (单位 为 字 节 ) 的 大 小 ， 这 个 大 小 
是 可 选 的， 如果 省 略 ，Oracle 为 每 个 聚 禾 键 值 预 留 一 个 数据 块 。INITIAL 参 数 指定 聚 徐 的 第 一 
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个 区 的 大 小 (单位 为 字 节 )，NEXT 参 数 指定 将 要 分 配 的 下 一 个 区 的 大 小 (单位 为 字 节 )。 
PCTINCREASE 参 数 指定 一 个 百分比 ， 这 个 百分比 用 于 指定 第 三 个 和 后 续 的 区 比 前 一 个 区 增长 
的 大 小 (默认 值 为 50)。 在 我 们 的 例子 中 ， 我 们 指定 每 个 后 续 的 区 应 该 比 前 一 个 区 大 10%。 
一 旦 创建 好 了 哈 希 聚 比 ， 就 可 以 创建 作为 这 个 结构 的 一 部 分 的 表 了 。 例 如 : 
CREATE TABLE Branch 
( branchNo CHAR(4) PRIMARY KEY, 
Ca BranchIndexedCluster (PranchNo) : 
使 用 索引 聚 徐 指南 
当 决 定 是 否 聚 乱 表 时 ， 你 会 发 现下 述 指南 会 很 有 帮助 : 
。 考 虑 对 经 常 在 连接 语句 中 访问 的 表 建 立 聚 入。 
。 如 果 表 只 是 偶尔 被 连接 或 者 它们 的 公共 列 值 经 常 被 修改 ， 则 不 要 京 徐 表 。( 修 改 记录 的 
京 簇 键 值 比 在 非 察 比 的 表 中 修改 此 值 要 花费 更 多 的 时 间 ， 因 为 Oracle 必 须 将 修改 的 记录 
移植 到 其 他 的 块 中 以 维护 聚 簇 。) 
。 如 果 经 常 需要 在 一 个 表 上 进行 完全 搜索 ， 则 不 要 聚 徐 这 个 表 (对 一 个 豪 簇 表 进 行 完 全 搜 
索 比 在 非 聚 徐 表 上 进行 完全 搜索 用 的 时 间 长 ，Oracle 可 能 要 读 更 多 的 块 ， 因 为 表 是 被 一 
起 存储 的 )。 
。 如 果 经 常 从 一 个 父 表 和 相应 的 子 表 中 查询 记录 ， 则 考虑 给 1 对 多 (1:*) 关系 创建 聚 丛 表 。 
( 子 表 记录 存储 在 与 父 表 记录 相同 的 数据 块 中 ， 因 此 当 检 索 它 们 时 可 以 同时 在 内 存 中 ， 
因此 需要 Oracle 完 成 较 少 的 IO ) 。 
。 如 果 经 常 查询 同一 个 父 表 中 的 多 个 子 记 录 ， 则 考虑 单独 将 子 表 聚 徐 。( 这 样 提高 了 从 相 
同 的 父 表 查询 子 表 记录 的 性 能 ， 而 且 也 没有 降低 对 父 表 进行 完全 搜索 的 性 能 ) 。 
。 如 果 从 所 有 有 相同 聚 得 键 值 的 表 查 询 的 数据 超过 了 一 个 或 两 个 Oracle 块 ， 则 不 要 聚 卵 表 。 
《要 访问 在 一 个 聚 徐 表 中 的 记录 ，Oracle 读 取 所 有 包含 那个 记录 值 的 全 部 数据 块 ， 如 果 
记录 占据 了 多 个 数据 块 ， 则 访问 一 个 记录 需要 读 的 次 数 比 在 一 个 非 聚 徐 的 表 中 访问 相同 
记录 读 的 次 数 要 多 ) 。 


D.7.2 哈 希 聚 簇 


哈 希 聚 氮 以 与 索引 聚 徐 相似 的 方式 对 表 数 据 进行 聚 簇 。 但 以 哈 希 聚 簇 存 储 的 记录 基于 对 
记录 的 聚 秘 键 值 应 用 哈 希 国 数 的 结果 。 有 相同 哈 希 键 值 的 所 有 记录 被 存储 在 一 起 。Oracle 建 议 
在 下 述 情况 下 使 用 哈 希 聚焦 : 

“基于 涉及 所 有 育 敌 键 列 的 相等 条 件 的 查询 (例如 ， 返 回 分 公司 B001 的 所 有 记录 )。 

* 聚 簇 表 是 静态 的 或 者 当 创建 育 秘 时 我 们 可 以 确定 记录 的 最 大 数量 和 所 需 的 最 大 空间 。 

在 Oracle 中 ， 要 在 branchNo 列 上 创建 一 个 叫做 BranchHashCluster 的 哈 希 聚 和 化 ， 可 以 使 用 
如 下 的 SQL 语句 : 

CREATE CLUSTER BranchHashCluster 

{ branchNo CHAR{4)) 

HASH IS branchNo HASHKEYS 5000; 

使 用 哈 希 聚 绕 的 指南 

你 会 发 现 当 决定 是 否 使 用 哈 希 聚 簇 时 下 述 指南 很 有 帮助 : 
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。 当 经 常 使 用 有 相同 列 的 包含 相等 条 件 的 查询 子 句 访问 表 时 , 考虑 使 用 哈 希 聚 禾 来 存储 表 。 
用 这 些 列 作为 聚 徐 键 。 

。 如 果 可 以 确定 存放 具有 给 定 聚 焦 键 值 的 所 有 记录 所 需 的 空间 (包括 现在 的 和 将 来 的 )， 
则 将 此 表 以 哈 希 聚 铸 存 储 。 

。 如 果 空 间 不 够 ， 并 且 不 能 为 将 要 插入 的 新 记录 分 配额 外 的 空间 ， 那 么 不 要 使 用 哈 希 聚 得 。 
。 如 果 侦 尔 创建 一 个 新 的 、 很 大 的 哈 希 聚 往来 保存 这 样 的 表 是 不 切实 际 的 ， 那 么 不 要 用 了 哈 
希 诊 徐 存储 经 常 增长 的 表 。 

。 如 果 经 常 需要 进行 全 表 搜 索 , 并 且 必 须要 为 表 的 预期 增长 中 的 哈 希 聚 得 分 配 足够 的 空间 ， 
则 不 要 将 此 表 以 哈 希 聚 复 存 储 。( 这 样 的 完全 检索 必须 要 读 分 配给 哈 希 聚 往 的 全 部 的 块 ， 
即使 有 些 块 可 能 只 包含 很 少 的 记录 。 单 独 地 存储 表 将 减少 由 完全 的 表 检 索 读 取 的 块 的 数 
量 。) 

“如果 你 的 应 用 程序 经 常 修改 聚 簇 键 的 值 ， 则 不 要 存储 将 表 以 哈 希 育 复 方式 存储 。 

* 不管 这 个 表 是 否 经 常 与 其 他 表 连 接 ， 只 要 进行 哈 希 对 于 基于 以 前 的 指南 的 表 是 合适 的 ， 
那么 在 哈 希 聚 簇 中 存储 一 个 表 可 能 是 有 用 的 。 


附录 小 结 


“ 堆 文 件 适 合 在 文件 中 插入 大 量 记 录 的 情况 。 但 对 仅 查 询 已 选择 的 记录 的 情况 就 是 不 合适 的 。 

。 当 检索 是 基于 精确 的 键 匹配 时 哈 希 文件 是 合适 的 。 但 当 检 索 是 基于 模式 匹配 、 值 的 范围 、 
部 分 键 或 当 检索 是 基于 其 他 的 非 哈 希 列 时 ， 哈 希 文件 就 不 合适 了 。 

“ISAM 比 哈 希 更 灵活 ， 它 支持 基于 精确 键 匹配 、 模 式 匹 配 、 值 的 范围 和 部 分 键 规格 说 明 
的 检索 。 但 是 ，ISAM 索 引 是 静态 的 ， 因 此 当 表 被 修改 时 性 能 会 恶化 。 更 新 也 引起 了 
ISAM 文 件 丢 失 访 问 键 顺序 ， 因 此 按 访问 键 顺序 的 访问 将 会 变 慢 。 

* 这 两 个 问题 被 B 树 文件 组 织 方式 克服 了 ，B* 树 索引 是 动态 的 索引 。 如 果 一 个 表 不 是 经 党 
被 修改 或 不 是 很 大 ， 则 ISAM 结 构 可 能 会 更 有 效 ， 因 为 它 的 索引 级 别 比 B' 树 低 ，B' 树 的 
叶 结 点 包含 记录 指针 。 

* 二 级 索引 提供 了 为 基本 表 指定 一 个 附加 键 的 机 制 ， 这 个 附加 键 可 以 用 于 更 有 效 地 检索 数 
据 。 但 在 这 个 机 制 中 有 附加 的 开销 ， 而 且 使 用 二 级 索引 必须 要 与 检索 数据 获得 的 性 能 进 
行 权 衡 。 

“ 聚 簇 是 一 个 或 多 个 表 作 为 一 个 组 物理 地 存储 在 一 起 ， 因 为 它们 共享 相同 的 列 并 且 经 常 一 
起 使 用 。 有 了 物理 地 存储 在 一 起 的 相关 的 记录 ， 可 以 减少 磁盘 存 取 时 间 。 符 簇 中 的 表 的 
相关 列 被 称 为 聚 徐 键 。 育 狂 键 仅 存储 一 次 ， 因 此 京 徐 存 储 一 组 表 的 效率 比 单独 存储 ( 没 
有 至 簇 ) 每 个 表 要 高 。Oracle 支 持 两 种 类 型 的 聚 复 : 索引 聚 秘 和 哈 希 聚 铀 。 
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在 这 个 附录 中 你 将 学 到 : 

。 关 于 构建 逻辑 数据 模型 的 更 多 的 知识 。 

。 关 于 常用 的 逻辑 数据 模型 。 

在 这 个 附录 中 ， 我 们 介绍 了 一 些 也 许 你 会 觉得 有 用 的 常用 的 数据 模型 。 实 际 上 ， 据 估计 
1/3 的 数据 模型 是 由 适用 于 大 多 数 公司 的 普通 结构 组 成 的 ， 剩 下 的 2/3 是 由 工业 或 者 公司 的 特定 
情况 组 成 的 。 这 样 ， 大 多 数 的 数据 模型 就 是 在 重复 你 以 前 在 其 他 公司 已 经 做 过 很 多 次 的 工作 。 

因此 ， 这 个 附录 的 两 个 主要 目的 就 是 向 我 们 提供 : 

。 建 立 数据 模型 的 附加 知识 。 

。 在 你 的 业务 中 有 用 的 数据 模型 模板 。 虽 然 这 里 提 到 的 模型 也 许 并 不 能 确切 地 描述 你 的 公司 的 

要 求 ， 但 是 它 可 能 会 给 你 提供 一 个 起 点 ， 使 你 能 更 好 地 建立 符合 你 公司 特殊 要 求 的 数据 模型 。 

我 们 提供 了 下 面 的 经 常用 到 的 商业 领域 的 模型 

。 客 户 订购 登记 (customer order entry ) 

。 库 存 控制 (inventory control) 

。 资产 管理 (asset management ) 

。 项目 管理 (project management) 

。 课 程 管 理 (course management ) 

。 人 力 资源 管理 (human resource management ) 

。 工 资 管理 (payroll management ) 

我 们 也 提供 了 下 面 这 些 用 的 也 许 不 是 很 常用 的 数据 模型 ， 但 是 这 些 模 型 对 于 商业 目标 和 
我 们 的 学 习 目 的 来 说 还 是 有 用 的 : 

。 车 辆 租赁 (vehicle rentals ) 

。 学 生 住宿 (student accommodation ) 

。 客户 运送 (client transportation ) 

。 出 版 商 印 刷 (publisher printing ) 

。 国 家 图 书馆 (county library ) 

。 房 地 产 租赁 (real estate rentals ) 

。 旅 行 代 理 (travel agent) 

。 学 生 管 理 (student results) 

在 每 个 示例 中 ， 我 们 都 提供 了 对 需求 的 简单 描述 ， 并 且 提 供 了 一 个 典型 逻辑 数据 模型 的 
例子 ， 并 将 这 些 模型 映射 为 一 系列 的 表 。 我 们 假设 你 熟悉 本 书 使 用 的 数据 模型 的 符号 ， 如 果 
你 不 熟悉 的 话 ， 可 以 参看 第 7 章 的 ER 模型 ， 那 里 介绍 了 主要 的 概念 和 在 附录 中 要 用 到 的 符号 。 
你 也 可 以 在 附录 B 中 找到 方法 学 的 概要 。 


E.1 客户 订购 登记 
一 个 公司 希望 为 其 客户 订购 行为 建立 一 个 数据 库 。 一 个 消费 者 可 以 有 一 个 或 多 个 订单 ， 








298 附 器 





每 个 订单 可 以 有 一 种 或 多 种 商品 。 每 个 订单 有 一 个 发 票 ， 可 以 通过 多 种 方式 来 支付 ， 例 如 支 
票 、 信 用 卡 或 者 现金 。 开 始 运行 这 个 客户 订购 登记 的 员工 的 名 字 要 被 记 下 来 。 

有 一 个 相应 的 部 门 工作 人 员 来 负责 整理 订单 并 把 这 些 订 单 发 给 顾客 。 如 果 订 单 上 的 货物 
在 库 中 没有 ， 就 需 写 明 库 中 有 什么 ， 这 样 在 订单 中 可 能 就 会 用 其 他 货物 来 填充 。 它 的 逻辑 数 


据 模 型 如 图 E-1 所 示 ， 相 关 的 表 如 图 E-2 所 示 。 


1..1 1..1 
全 














pMethodFor > 
























PartOf 

Raises 1 1 vy 1] 。 

Places b> Order Has > OrderDetail 
本 .… orderNo 1..1 1..* 

全 0 PackagedIn 1.1 

Processes 11 下 I 

Employee Prepares > Shipment 

employeeNo “1 0O..* shipmentNo 








图 E-1 客户 订单 项 的 逻辑 数据 模型 








(customerNo, customerName, customerStreet, customerCity, customerState, 
customerZipCode, custTelNo, custFaxNo, DOB, maritalStatus, creditRating) 
Primary Key customerNo 

Alternate Key custTelNo 

Alternate Key custFaxNo 


Employee (employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, dateStarted) 
Primary Key employeeNo 
Alternate Key socialSecurityNumber 


Invoice . (invoiceNo, dateRaised, datePaid, creditCardNo, holdersName, expiryDate, orderNo, 
pMethodNo) 
Primary Key invoiceNo 
Foreign Key orderNo references Order(orderNo) 
Foreign Key pMethodNo references PaymentMethod(pMethodNo) 


Order (QrderNo, orderDate, billingStreet, billingCity, billingState, billingZipCode, promisedDate, 
status, customerNo, employeeNo) 
Primary Key orderNo 
Foreign Key customerNo references Customer(customerNo) 
Foreign Key employeeNo references Employee(employeeNo) 


OrderDetail (orderNo, productNo, quantityOrdered) 

Primary Key orderNo, productNo 
Foreign Key orderNo references Order(orderNo) 
Foreign Key productNo references Product(ProductNo) 


图 E-2 客户 订单 项 的 表 


Customer 
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PaymentMethod (pMethodNo, paymentMethod) 
Primary Key PMethodNo 


(productNo, productName, serialNo, unitPrice, quantityOnHangd, reorderLevel, 
reorderQuantity, reorderLeadTime) 

Primary Key productNo 

Alternate Key serialNo 


Product 


里 
(hipmentNo, quantity, shipmentDate, completeStatus, OrderNo, productNo, 
employeeNo, sMethodNo) 


Primary Key shipmentNo 
Foreign Key orderNo, productNo references OrderDetail(orderNo, productNo) 


Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key sMethodNo references ShipmentMethod(sMethodNo) 


ShipmentMethod (sMethodNo, shipmentMethod) 
Primary Key sMethodNo 


Shipment 








E.2 库存 控制 


一 个 公司 希望 为 控制 它 的 库存 建立 一 个 数据 库 ， 库 存 中 的 产品 被 分 为 儿 类 ， 如 服装 、 食 品 
和 文具 。 当 产品 需要 从 供应 商 那里 重新 订购 时 ， 工 作 人 员 需 要 提出 一 个 购买 订单 。 跟 踪 记 录 要 
提供 买 进 、 卖 出 的 货物 以 及 其 他 的 费用 。 逻 辑 数据 模型 如 图 E-3 所 示 ， 相 关 的 表 如 图 E-4 所 示 。 


Employee 
employeeNo 
R 1..1 


了 0..* 
全 1..* 














十 OrderFor 







图 E-3 库存 控制 的 逻辑 数据 模型 


在 D.1.2 节 定义 


Product (productNo, productName, serialNo, unitPrice, quantityOnHand, reorderLevel, 
reorderQuantity, reorderLeadTime, categoryNo) 
Primary Key productNo 
Alternate Key serialNo 
Foreign Key categoryNo references ProductCategory(categoryNo) 

ProductCategory (categoryNo, categoryDescription) 
Primary Key categoryNo 

PurchaseOrder (purchaseOrderNo, purchaseOrderDescription, orderDate, dateRequired pedD 

1 ， , Shi te, 

freightCharge, supplierNo, employeeNo) 9 "uP °° 
Primary Key purchaseOrderNo 
Foreign Key supplierNo references Supplier(supplierNo) 
Foreign Key employeeNo references Employee(employeeNo) 


图 E-4 库存 控制 的 表 
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(supplierNo, supplierName, supplierStreet, supplierCity, supplierState, supplierZipCode, 
suppTelNo, suppFaxNo, suppEmailAddress, suppWebAddress, contactName, 
contactTelNo, contactFaxNo, contactEmailAddress, paymentTerms) 

Primary Key supplierNo 

Alternate Key supplierName 

Alternate Key SuppIelNo 

Alternate Key suppFaxNo 


(transactionNo, transactionDate, transactionDescription, unitPrice, unitsOrdered, 
unitsReceived, unitsSold, unitsWastage, productNo, purchaseOrderNo) 


Primary Key transactionNo 
Foreign Key productNo references Product(productNo) 
Foreign Key purchaseOrderNo references PurchaseOrder(purchaseOrderNo) 


图 E-4 《〈 续 ) 





Supplier 














Transaction 








E.3 资产 管理 


一 个 公司 希望 为 管理 它 的 每 批 资产 (如 PC 机 、 打 印 机 、 汽 车 、 桌 子 、 椅 子 等 ) 建立 一 个 
数据 库 。 资 产 被 分 为 几 类 ， 如 计算 机 和 设备 。 一 个 资产 被 分 配给 一 个 员工 。 通 常情 况 下 ， 财 
务 部 门 的 工作 人 员 要 检查 每 批 资产 的 现 有 市 场 价值 ， 并 记录 下 日 期 和 现 有 价值 。 作 为 估价 的 
结果 ， 公 司 也 许 会 决定 卖 掉 现 有 资产 。 同 样 ， 每 批 资产 都 要 进行 维护 。 在 某 些 情况 下 ， 维 护 
是 需要 工作 人 员 来 进行 的 。 另 外 ， 也 可 能 是 拿 到 外 面 的 公司 去 进行 维护 。 它 的 逻辑 数据 模型 
如 图 E-5 所 示 ， 相 关 表 如 图 E-6 所 示 。 













ServiceAgent AssetCategory 
Performs | 0 Contains | 11 1..1 














了 1..* 
0..* 
全 


Assigned 


1..1 
Employee 
employeeNo 


图 E-5 资产 管理 的 逻辑 数据 模型 


在 D.1.2 节 定义 


Asset (assetNo, assetDescription, serialNo, dateAcquired, purchasePrice, currentValue, dateSold 
nextMaintenanceDate, employeeNo, assetCategoryNo, statusNo) " 
Primary Key assetNo 
Alternate Key serialNo 
Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key assetCategoryNo references AssetCategory(assetCategoryNo) 
Foreign Key statusNo references Status(statusNo) 


了 QO..* 
QO..* 


可 MaintainedBy 















Valuation 





















AssetCategory (assetCategoryNo, assetCategoryDescription) 
Primary Key assetCategoryNo 
Maintenance (maintenanceNo, maintenanceDate, maintenanceDescription, maintenanceCost, 





图 E-6 资产 管理 的 表 
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UL -一 


assetNo，employeeNo, agentNO) 

Primary Key maintenanceNo 

Foreign Key assetNo references Asset(assetNo) 

Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key agentNo references ServiceAgent(agentNo) 


(agentNo, agentName, agentStreet, agentCity, agentState, agentZipCode, agentTelNo, 
agentFaxNo, agentEmailAddress, agentWebAddress, contactName, contactTelNo, 
contactFaxNo, contactEmailAddress) 

Primary Key agentNo 

Alternate Key agentName 

Alternate Key agentTelNo 

Alternate Key agentFaxNo 


Status (statusNo, statusDescription) 
Primary Key statusNO 


Valuation (valuationNo, valuationDate, valuationPrice, assetNo, employeeNo) 
Primary Key valuationNo 
Foreign Key assetNo references Asset(assetNo) 
Foreign Key employeeNo references Employee(employeeNo) 


图 E-6 〈 续 ) 





E.4 项 目 管理 
一 个 顾问 公司 希望 建立 一 个 数据 库 来 帮助 管理 它 的 项 目 。 每 个 项 目 都 对 应 一 个 用 户 而 且 





Approves 


本 





图 E-7 项 目 管理 的 逻辑 数据 模型 





302 有 有 如 





有 一 个 任命 的 项 目 经 理 。 一 个 项 目 被 分 为 几 个 工作 包 ， 工 作 人 员 用 工作 包 来 核算 自己 的 时 间 
和 花费 。 每 个 员工 都 有 一 个 特殊 的 角色 ， 这 个 角色 定义 了 用 户 的 费用 比例 。 随 着 时 间 的 推移 ， 
一 个 工作 人 员 可 能 在 同一 个 项 目的 几 个 工作 包 中 工作 。 另 外 ， 大 多 数 (但 不 是 全 部 ) 工作 包 
都 有 一 定数 量 的 与 之 相关 的 可 交付 的 文档 ， 每 个 文档 也 许 是 由 多 个 工作 人 员 写 的 。 其 逻辑 数 
据 模型 如 图 E-7 所 示 ， 相 关 的 表 如 图 E-8 所 示 。 












Document 








DocumentAuthor 



















Employee 


Expense 


ExpenseType 


Project 






Role 





TimeBooked 






WorkPackage 










E.5 课程 管理 


一 个 培训 公司 希望 建立 一 个 关于 课程 信息 的 数据 库 。 公司 发 布 几 个 讨论 会 和 一 些 培训 课 
程 。 每 个 课程 由 一 些 员 工 在 某 个 地 点 完成 (如 内 部 研讨 会 ， Hilton 大 厦 S10 房 间 )。 费 用 随 着 课 


(clientNo, clientName, clientStreet, clientCity, clientState, clientZipCode, clientTelNo, 
clientFaxNo, clientWebAddress, contactName, contactTelNo, contactFaxNo, 
contactEmailAddress) 

Primary Key clientNo 

Alternate Key clientName 

Alternate Key clientTelNo 

Alternate Key clientFaxNo 


(documentNo, documentTitle, documentDate, versionNo, workPackageNo, 
approvedByEmployeeNo) 

Primary Key documentNo 

Foreign Key workPackageNo references WorkPackage(workPackageNo) 
Foreign Key approvedByEmployeeNo references Employee(employeeNo) 


) 
Primary Key documentNo, employeeNo 
Foreign Key documentNo references Document(documentNo) 
Foreign Key employeeNo references Employee(employeeNo) 


(employeeNo, dateStartRole, firstName, middleName, lastName, address, workTelExt, 
homeTelNo, empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, 
dateStarted, roleNo) 

Primary Key employeeNo 

Alternate Key socialSecurityNumber 

Foreign Key roleNo references Role(roleNo) 


(expenseNo, expenseDate, expenseDescription, expenseAmount, workPackageNo, 
employeeNo, expenseTypeNo) 

Primary Key expenseNo 

Alternate Key workPackageNo, employeeNo, expenseDate 

Foreign Key workPackageNo references WorkPackage(workPackageNo) 

Foreign Key employeeNo references Employee(employeeNo) 

Foreign Key expenseTypeNo reference ExpenseType(expenseTypeNo) 


(expenseTypeNo, expenseTypeDescription) 


Primary Key expenseTypeNo 


(RrojectNo, projectName, plannedstartDate， plannedEndDate, actualStartDate, 
actualEndDate, projectedCost, actualCost, clientNo, managerEmployeeNo) 
Primary Key projectNo 

Foreign Key clientNo references Client(clientNo) 

Foreign Key managerEmployeeNo references Employee(employeeNo) 


(roleNo, roleDescription, billingRate) 
Primary Key roleNo 


(workPackageNo, employeeNo, dateStartWork, dateStopWork， timeWorked) 
Primary Key workPackageNo, employeeNo 

Foreign Key workPackageNo references WorkPackage(workPackageNo) 
Foreign Key employeeNo references Employee(employeeNo) 


(workPackageNo, plannedStartDate, plannedEndDate, actualStartDate, actualEndDate 


ProjectedCost, actualCost, projectNo) 
Primary Key workPackageNo 
Foreign Key projectNo references Project(projectNo) 


图 E-8 项 目 管理 的 表 
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程 不 同 或 者 公司 委托 的 代表 的 数量 不 同 而 不 同 。 例如， 如 果 公 司 派 一 个 人 ， 收费 可 能 是 $1000。 
如 果 派 两 个 人 ， 则 第 一 个 人 收费 是 $1000， 第 二 个 人 的 费用 也 许 就 是 $750。 某 项 课程 可 能 由 儿 
个 代表 参加 ， 这 依赖 于 一 些 课程 的 整体 规定 。 每 个 代表 可 以 以 个 人 或 公司 的 名 义 来 注册 。 注 
册 了 代表 的 员工 的 名 字 将 被 记录 下 来 。 发 票 被 交 给 本 人 或 者 是 公司 。 其 逻辑 数据 模型 如 图 E-9 


所 示 ， 相 关 的 表 如 图 E-10 所 示 。 


pMethodNo 













1..* 


FeeFor 









0..* 1..1 
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1 
pF 1..* 
0..1 
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图 E-9 课程 管理 的 逻辑 数据 模型 


Client 在 D.4.2 节 定义 
Employee 在 D.1.2 节 定义 
PaymentMethod 在 D.1.2 节 定义 


Delegate (delegateNo, delegateTitle, delegateFName, delegateLName, delegateStreet, delegateCity, 
delegateState, delegateZipCode, attTelNo, attFaxNo, attEmailAddress, clientNo) 
Primary Key delegateNo 
Foreign Key clientNo references Client(clientNo) 


(bookingNo, bookingDate, locationNo, courseNo, bookingEmployeeNo) 
Primary Key bookingNo 

Foreign Key locationNo references Location(locationNo) 

Foreign Key courseNo references Course(courseNO) 

Foreign Key bookingEmployeeNo references Employee(employeeNo) 


(courseNo, courseName, courseDescription, startDate, startTime, endDate, endTime, 
maxDelegates, confirmed, delivererEmployeeNo, courseTypeNo) 

Primary Key courseNo 

Foreign Key delivererEmployeeNo references Employee(employeeNo) 

Foreign Key courseTypeNo references CourseType(courseTypeNo) 


(courseFeeNo, feeDescription, fee, courseNo) 





图 E-10 课程 管理 的 表 
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Primary Key courseFeeNo 
Foreign Key courseNo references Course(courseNo) 


CourseType (courseTypeNo, courseTypeDescription) 
Primary Key courseTypeNo 


Invoice (invoiceNo, dateRaised, datePaid, creditCardNo, holdersName, expiryDate, 
registrationNo, pMethodNo) 
Primary Key invoiceNo 
Foreign Key registrationNo references Registration(registrationNo) 
Foreign Key pMethodNo references PaymentMethod(pMethodNo) 


Location | (locationNo, locationName, maxSize) 
Primary Key locationNo 


Registration (registrationNo, registrationDate, delegateNo, courseFeeNo, registerEmployeeNo, 
CourseNo) 
Primary Key registrationNo 
Foreign Key delegateNo references Delegate(delegateNo) 
Foreign Key courseFeeNo references CourseFee(courseFeeNo) 
Foreign Key registerEmployeeNo references Employee(employeeNo) 
Foreign Key courseNo references Course(courseNo) 





图 E-10 ( 续 ) 


E.6 人 力 资 源 管理 


人 力 资源 部 门 希望 建立 一 个 数据 库 来 管理 它 的 员工 。 一 个 公司 有 几 个 部 门 ， 而 一 个 员工 
属于 一 个 部 门 。 这 个 部 门 指派 一 个 经 理 来 全 面 负责 部 门 事务 和 部 门 员工 。 但 为 了 有 助 于 管理 
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图 E-11 人 力 资源 管理 的 数据 模型 
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好 部 门 工作 ， 某 些 工 作 人 员 被 任命 来 管理 一 组 人 员 。 当 有 一 个 新 的 员工 进入 公司 时 ， 需 要 他 
以 前 的 工作 经 历 和 成 绩 。 通 常 来 说 ， 每 个 员工 都 要 经 历 一 次 面试 ， 这 通常 是 由 经 理 来 进行 的 ， 
但 有 些 时 候 也 指派 给 一 个 代表 来 完成 。 

公司 定义 了 一 系列 的 职位 类 型 ， 例 如 经 理 、 业 务 分 析 员 、 销 售 人 员 和 秘书 ， 而 且 每 个 类 
型 都 有 相关 的 等 级 ， 员 工 所 处 的 位 置 决定 了 员工 的 工资 。 在 高 层 ， 工 资 是 可 以 通过 谈判 来 决 
定 的 。 职 位 依据 其 工作 量 来 分 配给 一 个 部 门 。 例 如 ， 一 个 部 门 可 能 分 配给 两 个 业务 分 析 员 的 
职位 。 每 个 岗位 会 分 配给 一 个 员工 ， 随 着 时 间 的 过 去 ， 各 个 职位 都 会 被 分 配给 工作 人 员 。 其 
逻辑 数据 模型 如 图 E-11 所 示 ， 相 关 的 表 如 图 E-12 所 示 。 





(departmentNo, departmentName, deptLocation, managerEmployeeNo) 
Primary Key departmentNo ~ 
Foreign Key managerEmployeeNo references Employee(employeeNo) 


(employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, dateStarted, 
dateLeft, departmentNo, supervisorEmployeeNo) 

Primary Key employeeNo 

Alternate Key socialSecurityNumber 

Foreign Key departmentNo references Department(departmentNo) 

Foreign Key supervisorEmployeeNo references Employee(employeeNo) 


(gradeNo, validFromDate, validToDate, gradeDescription, gradeSalary, 
noDaysLeaveEntitlement, positionTypeNo) 

Primary Key gradeNo, validFromDate 

Foreign Key positionTypeNo references PositionType(positionTypeNo) 


YalidFromDate, postNo, 
Primary Key gradeNo, validFromDate, postNo, availableFromDate 
Foreign Key gradeNo, validFromDate references Grade(gradeNo, validFromDate) 
Foreign Key postNo, availableFromDate references Post(postNo, availableFromDate) 


{instityutionNo, institutionName, instAddress, instTelNo, instFaxNo, instWebAddress, 
contactName, contactTelNo, contactFaxNo, contactEmailAddress) 

Primary Key institutionNo 

Alternate Key institutionName 

Alternate Key instTelNo 

Alternate Key instFaxNo 


(employeeNo, postNo, startDate, endDate) 

Primary Key employeeNo, postNo, startDate 

Foreign Key employeeNo references Employee(employeeNo) 

Foreign Key postNo, startDate references Post(postNo, availableFromDate) 


(positionTypeNo, positionTypeDescription) 


Primary Key positionTypeNo 


availableFromDate, availableToDate, postDescription, salariedHourly, 
fullPartTime, temporaryPermanent, freeLaborStandardsActExempt, departmentNo) 
Primary Key postNo, availableFromDate 
Foreign Key departmentNo references Department(departmentNo) 


(prevCompanyNo, pCompanyName, pCompanyStreet, pCompanyCity, pCompanysState, 
pCompanyZipCode, pCompanyTelNo, pCompanyFaxNo, pCompanyWebAddress, 
contactName, contactTelNo, contactFaxNo, contactEmailAddress) 

Primary Key prevCompanyNo 

Alternate Key pCompanyName 

Alternate Key pCompanyTelNo 

Alternate Key pCompanyFaxNo 


(QualificationName, employeeNo, gradeObtained, startQualDate, endQuaiDate, 
gpa, institutionNo) 

Primary Key qualificationName, employeeNo 

Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key institutionNo references Institution(institutionNo) 


图 E-12 人 力 资源 管理 的 表 
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{revieweeEmployeeNo, reviewerEmployeeNo, reviewDate, comments) 
Primary Key revieweeEmployeeNo, 

reviewerEmployeeNo, reviewDate 

Foreign Key revieweeEmpioyeeNo references Employee(employeeNo) 
Foreign Key reviewerEmployeeNo references Employee(employeeNo) 


WorkHistory (prevCompanyNo, employeeNo, prevPosition, prevGrade, prevSalary, prevLocation, 
prevResponsibilities) 

Primary Key prevCompanyNo, employeeNo 

Foreign Key prevCompanyNo references PrevCompany(prevCompanyNo) 

Foreign Key employeeNo references Employee(employeeNo) 








图 E-12 ”( 续 ) 


E.7 工资 管理 


工资 管理 部 门 希望 建立 一 个 数据 库 来 管理 员工 的 工资 。 要 计算 员工 的 工资 ， 就 需要 考虑 
不 在 休假 日 期 以 内 的 假期 、 工 作 期 间 的 病假 时 间 、 奖 金 和 扣除 的 部 分 。 必 须 指明 给 每 个 员工 
发 薪水 的 方式 ， 随 着 时 间 的 推移 ， 方 式 可 能 会 有 些 改变 。 大 多 数 的 员工 是 通过 银行 卡 来 结算 
工资 的 ， 但 是 也 有 一 部 分 人 使 用 现金 或 支票 。 如 果 是 通过 银行 卡 ， 就 需要 知道 账号 和 卡 的 类 
型 。 付 款 方式 只 可 能 是 一 种 方式 。 有 几 种 原因 可 以 扣除 工资 : 例如， 个 人 所 得 税 、 国 家 税 、 
医疗 保险 、 退 休 保 险 或 者 预付 款 。 其 逻辑 数据 模型 如 图 E-13 所 示 ， 相 关 的 表 如 图 E-14 所 示 。 







， employeeNo 


图 E-13 工资 管理 的 逻辑 数据 模型 


Employee 在 D.1.2 节 定义 


Bonus (employeeNo, bonusDate, bonusAmount, bonusTypeNo) 
Primary Key employeeNo, bonusDate 
Foreign Key employeeNo references Employee(empioyeeNo) 
Foreign Key bonusTypeNo references BonusType(bonusTypeNo) 


BonusType (bonusTypeNo, bonusDescription) 
Primary Key bonusTypeNo 


Deduction (employeeNo, deductDate, deductAmount, deductTypeNo) 
Primary Key employeeNo, deductDate 





图 E-14 工资 管理 的 表 
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Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key deductTypeNo references DeductType(deductTypeNo) 


DeductType (deductTypeNo, deductDescription) 
Primary Key deductTypeNo 


Holiday (employeeNo, startDate, endDate) 
Primary Key employeeNo, startDate 
Foreign Key employeeNo references Employee(employeeNo) 


PayDetails (employeeNo, startDate, routingNumber, accountType, bankName, bankAddress, payTypeNo) 
Primary Key employeeNo, startDate 
Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key payTypeNo references PayType(payTypeNo) 


PayHistory (payNo, employeeNo, payDate, checkNumber payAmount) 
Primary Key payNo 
Foreign Key employeeNo references Employee(employeeNo) 


PayType (payTypeNo, payTypeDescription) 
Primary Key payTypeNo 


SickLeave (employeeNo, startDate, endDate, reason) 
Primary Key employeeNo, startDate 
Foreign Key employeeNo references Employee(employeeNo) 


图 E-14 ( 续 ) 




















E.8 车 辆 租赁 


一 个 租赁 公司 希望 建立 一 个 数据 库 来 管理 对 用 户 的 车 辆 租赁 。 公 司 有 不 同 的 部 门 ， 每 
个 部 门 都 有 一 定 的 员工 包括 一 个 经 理 和 几 个 高 级 技师 ， 高 级 技师 负责 把 工作 分 配给 下 面 的 
一 组 普通 技工 。 每 个 部 门 都 有 库存 的 车 辆 ， 以 便 租 给 用 户 最 少 4 个 小 时 到 最 多 6 个 月 。 每 个 
用 户 和 公司 之 间 的 租赁 合同 都 有 唯一 的 租赁 号 。 用 户 必 须 拿 出 在 租用 期 间 的 保险 金 。 每 次 
租用 过 后 要 对 车 辆 进行 检查 ， 以 验证 它 的 损坏 程度 。 其 逻辑 数据 模型 如 图 E-15 所 示 ， 相关 
的 表 如 图 E-16 所 示 。 


Supervisor 






. 1.* 
RentalAgreement 


图 E-15 车 辆 租赁 的 逻辑 数据 模型 
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Client 在 D.4.2 节 定义 


Employee (employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, dateStarted, outletNo) 
Primary Key employeeNo 
Alternate Key socialSecurityNumber 
Foreign Key outletNo references Outlet(outletNO) 


FaultReport (vehLicenseNo, dateChecked, timeChecked, comments, employeeNo) 
Primary Key vehLicenseNo, dateChecked 
Foreign Key vehLicenseNo references Vehicle(vehLicenseNo) 
Foreign Key employeeNo references Employee(employeeNo) 


Outlet (OutletNo, outletStreet, outietCity outletState, outletZipCode, outletTelNo, outletFaxNo, 
managerEmployeeNo) 
Primary Key outletNo 
Alternate Key outletTelNo 
Alternate Key outletFaxNo 
Foreign Key managerEmployeeNo references Employee(employeeNo) 


RentalAgreement (rentalNo, dateStart, timeStart, dateReturn, timeReturn, mileageBefore, mileageAfter, 
policyNo, insuranceCoverType, insurancePremium, clientNo, vehLicenseNo) 
Primary Key rentalNo 
Alternate Key policyNo 
Foreign Key clientNo references Client(clientNo) 
Foreign Key vehLicenseNo references Vehicle(vehLicenseNo) 


Vehicle (vehLicenseNo, vehicleMake, vehicleMode!, color noDoors, capacity hireRate, outletNo) 
Primary Key vehLicenseNo 
Foreign Key outletNo references Outlet(outletNo) 











图 E-16 车 辆 租赁 的 表 


E.9 学 生 住宿 
一 个 大 学 的 后 勤 部 门 希 望 建立 一 个 数据 库 来 管理 学 生 宿舍 的 分 配 。 需 要 住宿 的 学 生 都 要 
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图 E-17 学 生 住 宿 的 逻辑 数据 模型 
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填写 一 个 申请 表 ， 表 中 有 学 生 的 详细 情况 和 要 申请 宿舍 的 类 型 的 介绍 以 及 时 间 。 学 生 也 许 租 
用 一 个 厅 室 的 一 个 房间 或 者 是 学 生 公寓 。 厅 宝 只 能 提供 单独 的 房间 ， 房 间 有 房间 号 、 住 宿 
以 及 月 租金 。 住 宿 号 唯一 地 决定 了 被 后 勤 部 门 控制 的 厅 室 中 的 每 个 房间 ， 以 便 租 给 学 生 时 使 


用 。 每 个 厅 室 由 后 勤 部 门 的 一 个 成 员 管理 。 | 

后 勤 部 门 也 提供 公寓 给 学 生 ， 每 个 房间 有 一 个 唯一 的 公寓 号 。 这 些 公寓 房间 是 已 经 装修 
好 的 而 且 提 供 单个 房间 给 3 个 、4 个 或 者 是 5 个 学 生 一 起 住 。 公 寓 中 的 每 个 床位 都 有 月 租金 、 房 
间 号 和 住宿 号 。 住 宿 号 唯一 地 确定 了 所 有 学 生 公 寓 中 的 可 用 房间 ， 在 房间 租 给 学 生 时 使 用 。 
公寓 被 几 个 成 员 共同 监督 以 保证 住宿 能 够 维护 。 | 

在 每 个 新 的 学 年 开始 ， 签 订 新 的 租用 合同 ， 最 少 的 租用 时 间 为 一 个 学 期 ， 最 多 的 是 一 年 。 学 
生 要 交 一 个 学 年 的 住宿 费用 ， 然 后 每 个 学 期 都 有 一 个 发 票 。 如 果 学 生 在 一 个 规定 的 日 期 之 前 没有 
交 费 ， 则 会 收 到 两 封 提 示 交 费 的 信 。 其 逻辑 数据 模型 如 图 E-17 所 示 ， 相 关 的 表 如 图 E-18 所 示 。 


Employee 在 D.1.2 节 定义 
PaymentMethod 在 D.1.2 节 定义 


Apartment (apartNo, apartAddress noOfRoomsinApart) 
Primary Key apartNo 


Apartinspection . (apartNo, dateOfInspection, comments, status, employeeNo) 
Primary Key apartNo, dateOfinspection - 
Foreign Key apartNo references Apartment(apartNo) 
Foreign Key employeeNo references Employee(employeeNo) 


{hallName, hallAddress, hallTelNo, haliFaxNo, noOfRoomsInHall, managerEmployeeNo) 
Primary Key hallName 

Alternate Key hallTelNo 

Alternate Key hallFaxNo 

Foreign Key managerEmployeeNo references Employee(employeeNo) 


Invoice (inyoiceNo, semester, dateDue, datePaid, leaseNo, pMethodNo) 
Primary Key invoiceNo 
Foreign Key leaseNo references Lease(leaseNo) 
Foreign Key pMethodNo references PaymentMethod(pMethodNo) 


Reminder {invoiceNog, dateReminderlsent, dateReminder2sent, dateInterview, comments) 


Primary Key invoiceNo 
Foreign Key invoiceNo references Invoice(invoiceNo) 


(leaseNo, duration, dateStart, dateLeave, studentNo, placeNo) 
Primary Key leaseNo 

Alternate Key placeNo, dateStart 

Alternate Key studentNo, dateStart 

Foreign Key studentNo references Student(studentNo) 
Foreign Key placeNo references Room(placeNo) 


(placeNo, roomNo, rentPerSemester, hallName, apartNo) 
Primary Key placeNo 

Alternate Key roomNo, hallName 

Alternate Key roomNo, apartNo 

Foreign Key hallName references Hall(hallName) 
Foreign Key apartNo references Apartment(apartNo) 


Student (studentNo, studentFirstName, StudentMiddieintial， studentLastName, studentHomeStreet 
studentHomeCity, studentHomeState, studentHomeZipCode, studentHomeTelNo, 
studentSex, studentDOB, studentType, studentStatus, accommodationTypeRequired, 
accommodationDuration) 

Primary Key studentNo 


图 E-18 学 生 住宿 的 表 


站 





E.10 客户 运送 
一 个 专门 在 全 美国 进行 运输 业务 的 运送 公司 希望 建立 一 个 数据 库 以 控制 用 户 的 运输 订单 。 
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客户 向 一 个 办 事 处 进行 注册 可 以 有 一 个 或 多 个 订单 。 每 个 订单 都 描述 了 运输 的 路 线 ， 包 括 各 
个 地 点 和 目的 地 。 这样， 每 个 订单 的 运输 所 需 就 可 以 计算 出 来 了 。 运 输 所 需 包 括 这 次 运输 需 
要 的 班 数 和 拖车 数 等 。 每 个 办 事 处 分 配给 几 个 班 和 拖车 。 一 个 班 可 以 有 一 辆 或 两 辆 拖车 。 其 


逻辑 数据 模型 如 图 E-19 所 示 ， 相 关 的 表 如 图 E-20 所 示 。 
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图 E-19 客户 运送 的 逻辑 数据 模型 


























Client (clientNo, clientName, clientStreet, clientCity, clientState, clientZipCode, clientTelNo, 
clientFaxNo, clientWebAddress, contactName, contactTelNo, contactFaxNo, 
contactEmailAddress, officeNo) 

Primary Key clientNo 

Alternate Key clientTelNo 

Alternate Key clientFaxNo 

Foreign Key officeNo references Office(officeNo) 

Office (officeNo, officeAddress, officeTelNo, officeFaxNo) 
Primary Key officeNo 
Aiternate Key officeTelNo 
Alternate Key officeFaxNo 

ClientOrder {orderNo, dateOrder, collectionDate, collectionAddress, deliveryDate, deliveryAddress, 
loadWeight, loadDescription, clientNo) 

Primary Key orderNo 
Foreign Key clientNo references Client(clientNo) 
Trailer (trailerVehLicenseNo, trailerDescription, trailerLength, maxCarryingWeight, officeNo) 


Primary Key trailerVehLicenseNo 
Foreign Key officeNo references Office(officeNo) 


TransportReqts {orderNo, transportReqPartNo, unitVehLicenseNo, trailerVehLicenseNo], 
trailerVehLicenseNo2) 
Primary Key orderNo, transportReqPartNo 
Foreign Key unitVehLicenseNo references Unit(unitVehLicenseNo) 
Foreign Key trailerVehLicenseNol references Trailer(trailerVehLicenseNo) 
Foreign Key trailerVehLicenseNo2 references Trailer(trailerVehLicenseNo) 


Unit (unit YehLicenseNo, unitDescription, maxPayLoad, officeNo) 
Primary Key UnitVehLicenseNo 
Foreign Key officeNo references Office(officeNo) 






图 E-20 客户 运送 的 表 


E.11 出 版 商 印刷 


一 个 印刷 书 的 印刷 公司 希望 建立 数据 库 来 处 理 用 户 的 印刷 需要 。 一 本 书 的 出 版 发 行人 提交 了 
一 份 描述 印刷 工作 的 单据 。 印 刷 工作 需要 使 用 材料 ， 如 纸 和 墨水 ， 这 些 要 通过 一 个 或 多 个 购买 清 
单 来 指定 。 每 个 印刷 任务 都 要 指派 一 个 管理 人 来 负责 保证 这 次 印刷 任务 的 正确 执行 。 对 于 大 的 印 
刷 任 务 ， 一 般 还 要 分 配 其 他 的 工作 人 员 。 其 逻辑 数据 模型 如 图 E-21 所 示 ， 相 关 的 表 如 图 E-22 所 示 。 
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PrintJobType 













Publisher Places > PrintJob 
publisherNo 和 * printJobNo 1.. 


者 IsAliocated 


1 
EmpPrintJob 



















Manages 





二 WorkOn 





图 E-21 出 版 商 印 刷 的 逻辑 数据 模型 








Employee 在 D.1.2 节 定义 


EmpPrintJob (employeeNo, printJobNo, jobDate) 
Primary Key employeeNo, printJobNo 
Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key printJobNo references PrintJob(printJobNo) 


Item (itemNo, itemDescription, itemPrice, itemQuantityInStock, itemReorderLevel, 
itemReorderQuantity, itemReorderLeadTime) 
Primary Key itemNo 


PrintJob (printlobNo, printJobDescription, printJobDateReceived, printJobDateCompleted, 
managerEmployeeNo, publisherNo, printJobTypeNo) 
Primary Key printJobNo 
Foreign Key managerEmployeeNo references Employee(employeeNo) 
Foreign Key publisherNo references Publisher(publisherNo) 
Foreign Key printJobTypeNo references PrintJobType(printJobTypeNo) 


Publisher (publisherNo, publisherName, publisherStreet, publisherCity, publisherState, 
publisherZipCode, pubTelNo, pubFaxNo, pubWebAddress, contactName, contactTelNo, 
contactFaxNo, contactEmailAddress, creditRating) 

Primary Key publisherNo 
Alternate Key publisherName 
Alternate Key pubTelNo 
Alternate Key pubFaxNo 


POItem (purchaseOrderNo, itemNo, quantity) 
Primary Key purchaseOrderNo, itemNo 
Foreign Key purchaseOrderNo references PurchaseOrder (purchaseOrderNo) 
Foreign Key itemNo references Item(itemNo) 





























PrintJobType (printJobTypeNo, printJobTypeDescription) 1 
Primary key printJobTypeNo 

PurchaseOrder (RurchaseOrderNo, printJobNo, purchaseOrderDate) 
Primary Key purchaseOrderNo 






Foreign Key printJobNo references PrintJob(printJobNo) 





图 E-22 出 版 商 印 刷 的 表 
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E.12 国家 图 书馆 


一 个 国家 希望 建立 一 个 数据 库 来 管理 它 的 当地 图 书馆 。 每 个 图 书馆 都 有 一 定数 量 的 工作 人 员 ， 
其 中 的 一 个 被 指派 为 图 书馆 的 经 理 来 管理 这 里 的 员工 和 图 书馆 每 天 的 工作 。 每 个 图 书馆 都 储存 有 
大 量 的 书 和 CE。 每 个 市 民 在 注册 成 为 图 书馆 的 一 名 有 效 的 借 书 人 之 前 不 能 借 任 何 书 ， 但 是 在 注册 
之 后 就 可 以 从 国家 图 书馆 里 借阅 所 有 的 书 了 。 书 存储 在 书架 上 , 而 CE 存储 在 图 书馆 中 间 的 书架 上 。 
一 般 来 说 ， 一 个 图 书馆 都 存 有 每 本 书 和 CE 的 一 定数 量 的 拷贝 。 书 的 出 版 商 的 详细 信息 被 保存 ， 但 
不 保存 CE 出 版 商 的 详细 信息 。 要 寻找 一 个 项 目 ， 可 以 根据 书 或 者 CE 名 、 作 者 /艺术 家 的 名 字 、 书 
或 CE 的 种 类 、 出 版 商 的 名 字 来 查找 。 其 逻辑 数据 模型 如 图 E-23 所 示 ， 相 关 的 表 如 图 E-24 所 示 。 
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图 E-23 国家 图 书馆 的 逻辑 数据 模型 


Publisher 在 D.11.2 节 定义 

















Artist {artistNo, name) 
Primary Key artistNo 
Author (authorNo, name) 
Primary Key authorNo 
Book (ISBN, title, year, publisherNo, bookCategoryNo) 






Primary Key ISBN 






图 E-24 国家 图 书馆 的 表 
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Foreign Key publisherNo references Publisher(publisherNo) 
Foreign Key bookCategoryNo references BookCategory(bookCategoryNo) 


BookAuthor (ISBN, authorNo) 
Primary Key ISBN, authorNo 
Foreign Key ISBN references Book(ISBN) 
Foreign Key authorNo references Author(authorNo) 









BookCategory (bookCategoryNo, bookCatDescription) 
Primary Key bookCategoryNo 


BookCopy (catalogNo, bookShelfNo, ISBN, dateInStock, libraryNo) 
Primary Key catalogNo 
Alternate Key bookShelfNo 
Foreign Key ISBN references Book(ISBN) 
Foreign Key libraryNo refere xces Library(libraryNo) 













CD (cdNo, title, releaseDate, cdCategoryNo) 

Primary Key cdNo 

Foreign Key cdCategoryNo references CDCategory(cdCategoryNo) 
CDArtist (cdNo, artistNo) 






Primary Key cdNo, artistNo 
Foreign Key cdNo references CD(cdNo) 
Foreign Key artistNo references Artist(artistNo) 


CDCategory (cdCategoryNo, cdCatDescription) 


Primary Key cdCategoryNo 


CDCopy {catalogNo, cdRackNo, cdNo, datelnStock， libraryNo) 
Primary Key catalogNo 
Alternate Key cdRackNo 
Foreign Key cdNo references CD(cdNo) 
Foreign Key libraryNo references Library(libraryNo) 


Employee (employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, dateStarted, libraryNo) 
Primary Key employeeNo 
Alternate Key socialSecurityNumber 
Foreign Key libraryNo references Library(libraryNo) 


Library (libraryNo, libStreet, libCity, libState, libZipCode, libTelNo, 
libFaxNo, libWebAddress, managerEmployeeNo) 
Primary Key libraryNo 
Alternate Key libTelNo 
Alternate Key libFaxNo 


Foreign Key managerEmployeeNo references Employee(employeeNo) 


Loan {catalogNo, memberNo, dateOut, dateReturn) 
Primary Key catalogNo, memberNo 


Foreign Key CatalogNo references BookCopy(catalogNo) and CDCopy(catalogNo) 
Foreign Key memberNo references Member(memberNo) 


Member (memberNo, memTitle, memFirstName, memMiddleName, memLastName, memAddress, 
mem WorkTelExt, memHomeTelNo, memDOB, memsSex, dateJoined, libraryNo) 

Primary Key memberNo 

Foreign Key libraryNo references Library(libraryNo) 


图 E-24 ( 续 ) 

























E.13 房地产 租赁 


~ 在 金 美 都 有 分 支 机 构 的 房地产 租 任 机 构 希望 建立 一 个 数据 库 米 管理 代表 房 主 出 租 记 
屋 ， 房 主 被 划分 为 Business 拥 有 者 和 Private 拥 有 者 。 在 每 个 分 支 机 构 中 ， 全 体 员工 检查 房屋 租 
赁 情况 ， 而 且 负 责 房屋 检查 和 租用 合同 。 一 些 员工 也 被 指定 为 Supervisor 角 色 ， 负责 监督 一 组 
员工 并 保证 分 支 机 构 的 有 效 管理 。 每 组 员工 的 管理 工作 由 一 个 Secretary 来 承担 ， 其 逻辑 数据 
模型 如 图 E-25 所 示 ， 相关 的 表 如 图 E-26 所 示 。 
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Lease 


PropertyType 


propTypeNo 
1..1 


二 plypeForRenter 
图 E-25 房地产 租赁 的 逻辑 数据 模型 


AllocatedEmp i supervisorEmployeeNo, secretaryEmployeeNo) 
Primary Key superviseeEmployeeNo 
Foreign Key superviseeEmployeeNo references Employee(employeeNo) 
Foreign Key supervisorEmployeeNo references Employee(employeeNo) 
Foreign Key secretaryEmployeeNo references Employee(employeeNo) 


Branch (branchNo, branchStreet, branchCity branchState, branchZipCode, branchTelNo, 
branchFaxNo, managerEmployeeNo) 
Primary Key branchNo 
Alternate Key branchTelNo 
Alternate Key branchFaxNo 
Foreign Key managerEmployeeNo references Employee(employeeNo) 


BusinessOwner (owneINo, businessName, businessAddress, businessTelNo, businessFaxNo, contactName, 
contactTelNo, contactFaxNo, contactEmailAddress) 
Primary Key ownerNo 
Alternate Key businessName 
Alternate Key businessTelNo 
Alternate Key businessFaxNo 


Employee (employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, typingSpeed, 
dateStarted, branchNo) 

Primary Key employeeNo 
Alternate Key socialSecurityNumber 
Foreign Key branchNo references Branch(branchNo) 


Lease {leaseNo, rentStart, rentFinish, depositPaid, renterNo, propertyNo) 
Primary Key leaseNo 














图 E-26 房地产 租赁 的 表 
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Foreign Key renterNo references Renter(renterNo) 
Foreign Key propertyNo references PropertyForRent(propertyNo) 


PrivateOwner (QwnerNo, ownerName, ownerAddress, ownerTeiNo) 
3 Primary Key OwnerNo 


PropertyForRent (PIQpertyNo, propStreet, propCity, propState, propZipCode, noRooms, rent, propTypeNo, 
OwnerNo, employeeNo, branchNo) 
Primary Key PropertyNo 
Foreign Key propTypeNo references PropertyType(propTypeNo) 
Foreign Key ownerNo references PrivateOwner(ownerNo) and BusinessOwner(ownerNo) 
Foreign Key employeeNo references Employee(employeeNo) 
Foreign Key branchNo references Branch(branchNo) 
















PropertyType (propTypeNo, propTypeDescription) 
Primary Key propTypeNo 
Renter (renterNo, r FName, rLName, rAddress, rTelNo, maxRent, prefTypeNo) 





Primary Key renterNo 
Foreign Key prefTypeNo references PropertyType(propTypeNo) 
Viewing (RropertyNo, renterNo, dateView, comments) 
Primary Key propertyNo, renterNo, dateView 
Foreign Key propertyNo references PropertyForRent(propertyNo) 
Foreign Key renterNo references Renter(renterNo) 


图 E-26 〈 续 ) 









E.14 旅行 代理 
一 个 旅行 代理 机 构 希 望 为 他 的 消费 者 假日 登记 行为 建立 一 个 数据 库 。 旅行 代理 在 美国 的 


0..1 
十 PartOfOutward 


AccommFacility 
1..* 





图 E-27 旅行 代理 的 逻辑 数据 模型 
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主要 城市 都 分 有 分 公司 。 消 费 者 可 以 通过 电话 在 任何 分 公司 登记 假期 旅行 。 尽 管 有 时 用 户 只 
需要 飞机 航班 或 者 是 食 宿 ， 但 是 每 个 假期 活动 中 一 般 都 有 飞机 航班 和 食 宿 。 一 旦 旅行 机 构 找 
到 了 适合 消费 者 的 活动 ， 就 会 提供 航班 和 食 宿 。 但 是 ， 预 约 只 能 保留 24 个 小 时 ， 在 这 期 间 消 
费 者 必须 决定 接受 或 拒绝 这 次 登记 。 一 旦 接受 这 次 登记 ， 假 日 旅游 的 账单 就 会 发 给 用 户 ， 而 
用 户 也 必须 在 出 发 前 最 少 四 个 星期 一 次 性 付 清 。 开 始 为 用 户 登 记 的 员工 的 名 字 也 要 记录 下 来 。 
其 逻辑 数据 模型 如 图 E-27 所 示 ， 相 关 的 表 如 图 E-28 所 示 。 





Branch 在 PD.13.2 告 定义 
ApartFacility (apartmentNo, facilityNo, comments) 


Primary Key apartmentNo, facilityNo 
Foreign Key apartmentNo references Apartment(apartmentNo) 
Foreign Key facilityNo references Facility(facilityNo) 


Apartment (apartmentNo, apartmentName, apartmentType, apartmentDescription, apartmentRating, 
apartmentStreet, apartmentCity apartmentState, apartmentCountry, apartmentZipCode, 
noOfRooms, operatorNo, resortNo) 

Primary Key apartmentNo 
Foreign Key operatorNo references Operator(operatorNo) 
Foreign Key resortNo references Resort(resortNo) 


Country (countryNo, tountryName) 
Primary Key countryNo 
Alternate Key countryName 
Customer (customerNo, customerName, customerStreet, CustomerCity, customerState, 


customerZipCode, custTelNo, custFaxNo, nationality, sex, DOB, passportNo) 
Primary Key customerNo : 
Alternate Key custTelNo 

Alternate Key custFaxNo 

Alternate Key passportNo 


CustomerParty (customerNo, holidayNo) 
Primary Key customerNo, holidayNo 
Foreign Key customerNo references Customer(customerNo) 
Foreign Key holidayNo references Holiday(holidayNo) 


Empioyee (employeeNo, title, firstName, middleName, lastName, address, workTelExt, homeTelNo, 
empEmailAddress, socialSecurityNumber, DOB, position, sex, salary, dateStarted, branchNo) 
Primary Key employeeNo 
Alternate Key socialSecurityNumber 
Foreign Key branchNo references Branch(branchNo) 


Facility (facilityNo, description, additionalCharge) 
Primary Key facilityNo 


Flight (fightNo, planeType, seatCapacity, airportDepart, departTime, airportArrive, arriveTime, 
OperatorNo) 
Primary Key flightNo 
Foreign Key operatorNo references Operator(operatorNo) 


Hotel (hotelNo, hotelName, hotelStreet, hotelCity hotelState, hotelCountry, hotelZipCode, 
hotelTelNo, hotelFaxNo, hotelType, hotelDescription, hotelRating, hotelManagerName, 
operatorNo, resortNo) 

Primary Key hotelNo 
Foreign Key operatorNo references Operator(operatorNo) 
Foreign Key resortNo references Resort(resortNo) 


HotelFacility (hotelNo, facilityNo, comments) 
Primary Key hotelNo, facilityNo 


Foreign Key hotelNo references Hotel(hotelNo) 
Foreign Key facilityNo references Facility(facilityNo) 
Holiday holidayNo, status, dateBooked, CateringType, startDate, finishDate, invoiceNo, totalCost, 
dateSent, datePaid, bookCustomerNo, hotelNo, apartmentNo, inwardFlightNo, 
inwardNoOfSeats, outwardFlightNo, outwardNoOfSeats, employeeNo, branchNo) 
Primary Key holidayNo 
Foreign Key bookCustomerNo references Customer(customerNo) 


图 E-28 旅行 代理 的 表 
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Foreign Key hotelNo references Hotel(hotelNo) 
Foreign Key apartmentNo references Apartment(apartmentNo) 
Foreign Key inwardFlightNo references Flight(flightNo) 
Foreign Key outwardFlightNo references Flight(flightNo) 
Foreign Key employeeNo references Employee(employeeNo) 
ForeignKey branchNo references Branch(branchNo) 


Operator (operatorNo, operatorName, operatorType, operatorStreet, operatorCity, operatorState, 
OperatorZipCode, operTelNo, operFaxNo, contactName, contactTelNo, contactFaxNo, 
contactEmailAddress) 

Primary Key operatorNo 
Alternate Key operTelNo 
Alternate Key operFaxNo 


Resort (resortNo, resortName, distanceFromAirport, timeFromAirport, countryNo) 
Primary Key resortNo 
Foreign Key countryNo references Country(countryNo) 


图 E-28 ( 续 ) 













E.15 学 生 管 理 


一 所 大 学 希望 建立 一 个 数据 库 以 便 对 学 生 进行 管理 。 当 一 个 学 生 进 入 学 校 时 ， 他 就 会 选择 
一 个 专业 。 每 个 学 生 也 会 指定 一 个 指导 老师 。 每 个 专业 每 年 由 一 些 课程 组 成 。 组 成 专业 的 课程 
的 最 小 和 最 大 数目 分 别 是 6 和 8。 每 个 学 生 都 要 选修 这 些 课程 并 且 通 过 ， 否 则 就 不 允许 进入 下 一 
年 的 下 一 个 专业 学 习 或 者 是 毕业 。 一 般 情 况 下 给 一 个 学 生 三 次 机 会 来 通过 这 门 课程 的 考试 。 但 
是 ， 也 可 以 在 任意 的 其 他 大 学 完成 课程 。 有 些 特殊 的 课程 可 以 在 一 个 或 多 个 专业 中 存在 。 
， 一 个 大 学 可 以 有 几 个 部 门 ， 每 个 部 门 可 以 提供 一 个 课程 的 部 长 职务 。 每 个 部 门 都 有 -个 
部 门 负责 人 ， 每 门 课程 也 都 有 一 个 课程 领导 。 每 个 课程 都 会 分 配 一 定数 量 的 员工 ( 称 为 课程 
合作 人 ) 来 负责 课程 的 估价 和 教学 。 其 逻辑 数据 模型 如 图 E-29 所 示 ，、 相 关 的 表 如 图 E-30 所 示 。 
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图 E-29 学 生 管理 的 逻辑 模型 








Course 


CourseModule 


Department 


Module 


Staff 


Student 


StudentModule 


StudentResult 





{courseNo, courseName, level, entranceRequirements maxNumber departmentNo, 
courseLeaderNo) 

Primary Key courseNo 

Alternate Key courseName 

Foreign Key departmentNo references Department(departmentNo) 

Foreign Key courseLeaderNo references Department(courseLeaderNo) 

{courseNo, moduleNo) 

Primary Key courseNo, moduleNo 

Foreign Key courseNo references Course(courseNo) 

Foreign Key moduleNo references Module(moduleNo) 


(departmentNo, departmentName, location, HODstaffNo) 

Primary Key departmentNo 

Alternate Key departmentName 

Foreign Key HODstaffNo references Staff(staffNo) 

(moduleNo, moduleName, semesterDelivered, moduleAims, moduleObjectives, 
moduleSyllabus, moduleResources, moduleModeOfAssessment, moduleCoordinatorStaffNo, 
departmentNo) 

Primary Key moduleNo 

Alternate Key moduleName 

Foreign Key moduleCoordinatorStaffNo references Staff(staffNo) 

Foreign Key departmentNo references Department(departmentNo) 


(StaffNo, title, frstName, lastName, address, homeTelNo, workTelExt, empEmailAddress, 
socialSecurityNumber, DOB, position, sex, salary, dateStarted, departmentNo) 

Primary Key staffNo 

Alternate Key socialSecurityNumber 

Foreign Key departmentNo references Department(departmentNo) 


(studentNo, studentFirstName, studentMiddleName, studentLastName, studentHomeStreet, 
studentHomeCity studentHomesState, studentHomeZipCode, studentHomeTelNo, 
familyHomeStreet, familyHomeCity familyHomestate， familyHomeZipCode, 
familyHomeTelNo, studentDOB, studentSex, nationality, courseNo, advisorStaffNo) 
Primary Key studentNo 

Foreign Key courseNo references Course(courseNo) 

Foreign Key advisorStaffNo references Staff(staffNo) 


Primary key studentNo, moduleNo 
Foreign Key studentNo references Student(studentNo) 
Foreign Key moduleNo references Module(moduleNo) 


attempt, attemptDate, mark, 
proposal, additionalComments) 
Primary key studentNo, moduleNo, attempt 
Foreign Key studentNo, moduleNo references StudentModule(studentNo, moduleNo) 








图 E-30 学 生 管理 的 表 








术 语 表 


Access method (访问 方法 ): 此 步骤 包括 从 文件 中 存储 和 检索 记录 。 

,Alias (别名 ): 某 属性 的 另 一 个 名 字 。 在 SQL 中 ， 可 以 用 别名 替换 表 名 。 

. Alternate key (备用 键 ，ER/ 关 系 模型 ): 在 实体 / 表 中 没有 被 选 为 主键 的 候选 键 。 

Anomalies (异常 ): 参见 update anomalies 。 

Application design (应 用 程序 设计 ): 数据 库 应 用 程序 生命 周期 的 一 个 阶段 ， 包 括 设计 用 
户 界 面 以 及 使 用 和 处 理 数据 库 的 应 用 程序 。 1 

Application server (应 用 服务 器 )， 处 理 业务 逻辑 以 及 三 层 结构 中 的 数据 处 理 层 。 

Attribute (属性 ) (关系 模型 ): 属性 是 关系 中 命名 的 列 。 

Attribute (属性 ) (ER 模型 ): 实体 或 关系 中 的 一 个 性 质 。 

Attribute inheritance (属性 继承 ): 子 类 成 员 可 以 拥有 其 特有 的 属性 ， 并 且 继 承 那些 与 超 
类 有 关 的 属性 的 过 程 。 

Authentication (认证 ): 确定 用 户 是 否 就 是 他 所 声明 的 那个 人 。 

Authorization (授权 ): 使 主体 可 以 合法 地 访问 数据 库 系统 和 数据 库 系统 对 象 的 权限 授予 

Backup (备份 ): 定期 将 数据 库 和 日 志文 件 (也 可 能 还 有 程序 ) 拷贝 到 离线 存储 介质 的 过 
程 。 

Base table (基本 表 ): 一 个 命名 的 表 ， 其 记录 物理 地 存储 在 数据 库 中 。 
Binary relationship (二 元 关系 ): 一 个 ER 术语 ， 用 于 描述 两 个 实体 间 的 关系 。 例 如 ， 
Branch Has Staff。 

Bottom-up approach ( 自 底 向 上 方法 ) (用 于 数据 库 设 计 ): 一 种 设计 方法 学 ， 它 从 标识 每 
个 设计 组 件 开 始 ， 然 后 将 这 些 组 件 育 合 成 一 个 大 的 单元 。 在 数据 库 设计 中 ， 可 以 从 标识 属性 
开始 底层 设计 ， 然 后 将 这 些 属性 组 合 在 一 起 构成 代表 实体 和 关系 的 表 。 

Business rules (业务 规则 ): 定义 或 约束 组 织 的 某 些 方面 的 规则 。 

Candidate key (候选 键 ，ER/ 关 系 模型 ): 仅 包 含 唯一 标识 实体 所 必需 的 最 小 数量 的 属性 / 
列 的 超 键 。 

Cardinality (基数 ): 描述 每 个 参与 实体 的 可 能 的 关系 数目 。 

Centralized approach (集中 式 方法 ， 用 于 数据 库 设计 ): 将 每 个 用 户 视图 的 需求 合并 成 新 
数据 库 应 用 程序 的 一 个 需求 集合 。 

Chasm trap 〈 深 坑 陷 阱 ): 假设 实体 间 存 在 一 个 关系 ， 但 某 些 实体 间 不 存在 通路 。 

Client (客户 端 ): 向 一 个 或 多 个 服务 器 请 求 服务 的 软件 应 用 程序 。 也 可 参见 两 层 /三 层 客 
户 服务 器 体系 结构 (two-tier/three-tier client-server architecture ) 。 

Clustering field ( 聚 乱 字段 ): 记录 中 的 任何 用 于 聚 鳞 (集合 ) 行 记录 的 非 键 字段 ， 这 些 
行 在 这 个 字段 上 有 相同 的 值 。 

Clustering index〈 聚 簇 索引 ): 在 文件 的 聚 簇 字 段 上 定义 的 索引 。 一 个 文件 最 多 有 一 个 主 











索引 或 一 个 府 簇 索引 。 

Column ( 列 ): 参见 attribute。 

Complex relationship (复杂 关系 ): 度数 大 于 2 的 关系 。 

Composite attribute (复合 属性 ): 由 多 个 简单 组 件 组 成 的 属性 。 

Composite key (复合 键 ): 包含 多 个 列 的 主键 。 

Concurrency control (并 发 控制 ): 在 多 用 户 环境 下 同时 执行 多 个 事务 并 保证 数据 完整 性 
的 一 个 DBMS 服 务 。 

Constraint (约束 ): 数据 库 不 允许 包含 错误 数据 的 一 致 性 规则 。 

Data administration (数据 管理 ): 管理 和 控制 公司 数据 ， 包 括 数据 库 规 划 、 开 发 和 维护 标 
准 、 策 略 和 过 程 ， 以 及 概念 和 逻辑 数据 库 设计 。 

Data conversion and loading (数据 转换 与 加 载 ): 数据 库 系 统 开发 生命 周期 中 的 一 个 阶段 ， 
包括 转换 现 有 数据 到 新 数据 库 中 以 及 将 现 有 应 用 程序 转换 到 新 的 数据 库 上 运行 。 

Data dictionary (数据 字典 ): 参见 system catalog 。 

Data independence (数据 独立 性 ): 使 用 数据 的 应 用 程序 的 数据 描述 部 分 。 这 意味 着 ， 如 
果 将 新 的 数据 结构 添加 到 数据 库 中 ， 或 者 数据 库 中 现 有 的 结构 被 修改 了 ， 那么 使 用 此 数据 库 
的 应 用 程序 就 会 受到 影响 ， 除非 应 用 程序 不 直接 依赖 于 被 修改 的 部 分 。 | 

Data mart (数据 集 市 ):; 数据 仓库 的 子 集 ， 支持 特定 部 门 和 业务 领域 的 需求 。 

Data mining (数据 挖掘 ): 从 大 的 数据 库 中 抽取 有 效 的 、 以 前 不 知道 的 、 可 理解 的 和 可 操 
作 的 信息 的 过 程 ， 并 使 用 这 些 信 息 制定 重要 的 商业 决策 。 

Data model (数据 模型 )” 描述 数据 、 数据 间 的 关系 以 及 公司 所 使 用 的 数据 的 约束 的 概念 
集合 。 

Data redundancy (数据 元 余 ): 参见 redundant data。 

Data security (数据 安全 ): 包括 对 数据 库 对 象 (如 表 和 视图 ) 的 访问 和 使 用 以 及 用 户 可 
以 在 这 些 对 象 上 实施 的 操作 。 

Data warehouse (数据 仓库 ): 从 不 同 的 操作 数据 源 抽取 出 来 的 企业 数据 的 固定 的 或 集成 
的 视图 ， 有 很 多 最 终 用 户 工具 可 用 于 支持 从 简单 到 很 复杂 的 查询 来 支持 决策 制定 。 

Database (数据 库 ): 逻辑 上 相关 可 共享 的 数据 (以 及 这 些 数据 的 描述 ) 集合 ， 用 于 处 理 
公司 所 需 的 信息 。 

Database adminstration (数据 库 管理 )， 对 数据 库 应 用 的 物理 实现 进行 管理 和 控制 ， 包括 物 
理 数 据 库 设 计 和 实现 、 建立 安全 性 和 完整 性 控制 、 监视 系统 性 能 以 及 必要 时 重新 组 织 数据 库 。 

(database) Application program (( 数 据 库 ) 应 用 程序 ): 通过 给 DBMS 发 出 合适 的 查询 
(通常 是 一 个 SQL 语句 ) 与 数据 库 交 互 作用 的 计算 机 程序 。 : 

Database design (数据 库 设 计 ): 数据 库 应 用 生命 周期 中 的 -- 个 阶段 ， 包括 创建 一 个 支持 
公司 的 操作 和 目标 的 数据 库 的 设计 。 

Database integrity (数据 库 完 整 性 ): 指 存储 数据 的 正确 性 和 -- 致 性 。 完整 性 通常 用 约束 
来 表达 。 

Database Management Systems (数据 库 管理 系统 ，DBMS ): 一 个 能 够 让 用 户 定义 、 创 建 
和 维护 数据 库 并 控制 对 数据 库 的 访问 的 软件 系统 。 

Database planning (数据 库 规划 ): 尽 可 能 有 效 地 实现 数据 库 应 用 的 各 阶段 的 管理 活动 。 
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Database security (数据 库 安全 性 ): 防止 数据 库 被 有 意 或 无 意 破 坏 的 机 制 。RDBMS 通 常 
提供 两 种 类 型 的 安全 : 数据 安全 和 系统 安全 。 

Database server (数据 库 服务 器 ): 同 服务 器 (参见 两 层 / 三 层 客 户 端 -服务 器 体系 结构 ) 。 

DBMS engine (DBMS 引 擎 ): 同 服务 器 (参见 两 层 客户 端 - 服 务 器 体系 结构 )。 

DBMS selection (选择 DBMS ): 数据 库 应 用 生命 周期 中 的 一 个 阶段 ， 包 括 选 择 一 个 合适 
的 DBMS 来 支持 数据 库 应 用 。 

Degree of a relationship (关系 的 度 ): 一 个 关系 中 参与 的 实体 的 个 数 。 

Denormalization 〈( 反 规范 化 ): 形式 上 ， 这 个 术语 指 的 是 对 基本 表 结 构 的 修改 ， 这 样 新 的 
表 比 原始 的 表 的 规范 化 程度 要 低 。 但 也 可 以 用 此 术语 更 宽泛 地 形容 将 两 个 表 合 并 成 一 个 新 表 
的 情景 ， 而 这 个 新 表 与 原来 的 表 具 有 相同 的 范式 ， 但 比 原 始 表 包 含 更 多 的 空 值 。 

Derived attribute (派生 属性 ): 表示 其 值 可 以 从 一 个 相关 属性 或 属性 集 的 值 派生 得 到 的 属 
性 ， 这 个 属性 在 实体 中 不 是 必需 的 。 

Design methodology (设计 方法 学 ): 一 种 结构 化 的 方法 ， 它 使 用 过 程 、 工 具 和 文档 来 支 
持 和 简化 设计 过 程 。 

Disjoint constraint (无 连接 约束 ): 描述 子 类 的 成 员 间 的 关系 ， 并 指明 超 类 某 个 成 员 是 否 
有 可 能 成 为 一 个 或 多 个 子 类 的 成 员 。 

Distributed database (分 布 式 数据 库 ): 多 个 逻辑 上 相互 关联 的 、 共 享 数据 的 (并 且 共 享 
数据 的 描述 )、 物 理 上 分 布 在 计算 机 网 络 上 的 数据 库 的 集合 。 

Distributed DBMS (分 布 式 DBMS，DDBMS ): 透明 地 管理 分 布 式 数据 库 的 软件 。 

Domain ( 域 ): 一 个 或 多 个 属性 的 取 值 范围 。 

Encryption (加 密 ): 用 一 个 特定 的 算法 对 数据 进行 编码 ， 使 数据 不 能 被 没有 密 钥 的 程序 
读 取 。 

Entity (实体 ): 具有 相同 性 质 的 对 象 的 集合 ， 它 是 由 用 户 或 公司 标识 并 可 以 独立 存在 的 。 

Entity integrity (实体 完整 性 ): 在 一 个 基本 表 中 ， 主键 列 的 取 值 不 能 为 空 。 

Entity occurrence (实体 出 现 ): 实体 中 的 一 个 唯一 可 标识 的 对 象 。 

Entity-Relationship model (实体 -关系 模型 ): 公司 的 实体 、 属性 和 关系 的 详细 逻辑 表示 。 

Fact-finding (事实 发 现 ): 使 用 诸如 面谈 和 提问 等 技术 收集 关于 系统 的 事实 、 需求 和 性 能 
的 形式 化 过 程 。 

Fan trap (扇形 陷阱 ): 当 从 第 三 个 实体 扇 出 的 两 个 实体 有 1:* 关 系 时 出 现 遍 形 陷阱 ， 但 这 
两 个 实体 在 它们 之 间 应 该 有 直接 关系 以 提供 必要 的 信息 。 

Field (字段 ): 同 tuple。 

File (文件 ): 存储 在 辅助 存储 器 中 的 相关 记录 的 一 个 命名 集合 。 , 

File-based system (基于 文件 的 系统 ): 一 个 文件 集合 ， 用 来 管理 (创建 、 插 入 、 删 除 、 
更 新 和 检索 ) 一 个 或 多 个 文件 中 的 数据 ， 并 产生 基于 这 些 文件 中 的 数据 的 应 用 (通常 是 报 
表 )。 

File organization (文件 组 织 ): 当 文件 存储 在 磁盘 上 时 ， 对 文件 中 的 记录 的 安排 方式 。 

First normal form (第 一 范式 ，1NF): 表 中 每 个 列 的 交叉 处 以 及 记录 包含 且 仅 包含 一 个 值 
的 表 。 

Foreign key (外 键 ): 一 个 表 中 的 一 个 列 或 者 多 个 列 的 集合 ， 这 些 列 匹配 某 些 其 他 (也 可 
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能 是 同一 个 ) 表 中 的 候选 键 。 

Fourth-Generation Language (第 四 代 语 言 ，4GL): -- 种 非 过 程 化 语言 ， 比 如 SQL， 它 只 
需要 用 户 定义 必须 完成 什么 操作 ，4GL 负 责 将 所 进行 的 操作 翻译 成 如 何 实现 这 些 操作 。 

Full functional dependency (完全 函数 依赖 ): 一 个 列 在 功能 上 依赖 于 复合 主键 ， 但 不 依赖 
于 主键 的 任何 一 个 子 集 的 条 件 。 

Functional dependency (函数 依赖 ): 描述 表 中 列 之 间 的 关系 。 例 如 ， 如 果 A 和 B 是 某 个 表 
中 的 列 ， 若 A 的 每 个 值 只 与 B 中 的 一 个 确定 值 对 应 ， 则 B 在 功能 上 依赖 于 A (表示 为 A 一 B)。 
(A 和 B 每 个 都 可 以 包含 多 个 列 。) 

Generalization ( 泛 化 ): 通过 标识 实体 间 的 公共 特征 使 实体 间 差 别 最 小 化 的 过 程 。 

Generalization hierarchy (汉化 层次 结构 ): 同 type hierarchy 。 

Global data model (全 局 数据 模型 ): 代表 整个 公司 (或 被 模型 化 的 公司 的 一 部 分 ) 的 数 

Implementation (实现 ): 数据 库 应 用 生命 周期 中 的 一 个 阶段 ， 包 括 数 据 库 和 应 用 程序 设 
计 的 物理 实现 。 

Index (索引 ): 一 种 允许 DBMS 将 特定 的 记录 更 快 地 放置 到 文件 中 ， 从 而 加 快 对 用 户 查询 
的 响应 的 数据 结构 。 

Information System (信息 系统 ): 能 够 在 整个 公司 范围 内 收集 、 管 理 、 控 制 和 分 发 数据 / 
信息 的 资源 。 

Inheritance (继承 ): 参见 attribute inheritance 。 

Integrity constraints (完整 性 约束 ): 防止 出 现 数据 库 中 的 数据 不 一 致 的 约束 。 

IS-A hierarchy (IS-A 层 次 结构 ): 同 type hierarchy 。 

Journaling (日 记 ): 将 所 有 对 数据 库 的 修改 保存 和 维护 在 日 志文 件 中 的 过 程 ， 使 在 失败 
时 可 用 它 有 效 地 恢复 数据 库 。 

Local logical data model (局 部 逻辑 数据 模型 )， 代 表 特 定 用 户 视图 或 用 户 视图 的 组 合 的 数 
据 模 型 。 

Logical database design (逻辑 数据 库 设 计 ): 基于 特定 的 数据 模型 构建 公司 的 数据 的 模型 
的 过 程 ， 但 不 依赖 于 特定 的 DBMS 以 及 其 他 的 物理 条 件 。 

Meta-data (元 数据 ): 关于 数据 的 数据 ， 参 见 system catalog。 

Mission objective (使 命 日 标 ): 标识 数据 库 必须 支持 的 特定 任务 。 

Mission statement (使 命 语句): 定义 数据 库 应 用 程序 的 主要 目标 。 

Multiplicity (多 样 性 ): 定义 与 某 个 相关 实体 的 一 次 出 现 有 关 的 实体 的 出 现 数目 。 

Multi-valued attibute (多 值 属性 )， 为 一 个 实体 的 出 现 保存 多 个 值 的 属性 。 

Nonkey attribute/column ( 非 键 属 性 / 列 ): 不 是 键 的 一 部 分 的 属性 / 列 。 

Normal forms (范式 ): 规范 化 过 程 的 一 个 阶段 。 前 三 个 范式 分 别 为 第 一 范式 (1NF)、 第 
二 范式 (2NF) 和 第 三 范式 (3NF)。 

Normalization (规范 化 ): 一 种 产生 带 有 需要 的 特性 的 技术 ， 这 种 特性 能 支持 用 户 和 公司 
的 需求 。 

Nul ( 空 值 ): 表示 一 个 列 的 值 目前 还 不 知道 或 对 于 当前 记录 来 说 还 不 能 使 用 。 

Object-oriented Data Model (面向 对 象 数据 模型 ， OODM): 在 面向 对 象 程序 设计 中 捕获 
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对 象 语义 的 数据 模型 。 

Object-oriented Database (面向 对 象 数据 库 ，OODB ): 在 面向 对 象 数据 模型 中 定义 的 持 
入 的 和 共享 的 对 象 的 信息 库 。 | 

Object-oriented DBMS (面向 对 象 DBMS，OODBMS ): 面向 对 象 数据 库 的 管理 程序 。 

Object-relational DBMS (面向 关系 DBMS，ORDBMS ): 扩展 关系 DBMS 结 合 “ 对 象 ” 的 
一 些 概念 。 没 有 单独 的 ORDBMS ， 它 是 这 样 的 一 些 系统 ， 其 特性 依赖 于 扩展 的 方式 和 程度 。 

OnLine Analytical Processing (联机 分 析 处 理 ，OLAP ): 对 大 量 的 多 维 数据 进行 动态 的 综 
合 、 分 析 和 合并 。OLAP 描 述 了 使 用 统计 数据 的 多 维 视图 以 便 快 速 访问 进行 高 级 数据 分 析 所 需 
的 重要 信息 的 技术 。 

Operational maintenance (操作 性 维护 ): 数据 库 应 用 生命 周期 的 一 个 阶段 ， 包 括 监视 和 
维护 系统 安装 后 的 运行 。 

Participation constraint (参与 约束 ，EER 模 型 ): 确定 超 类 中 的 每 个 出 现 是 否 必须 作为 子 
类 的 一 个 成 员 进行 参与 。 

Participation constraint (参与 约束 ，BER 模 型 ): 确定 是 否 所 有 或 者 仅仅 是 某 些 实体 出 现 参 
与 到 关系 中 。 

Physical database design (物理 数据 库 设计 ): 在 二 级 存储 上 产生 数据 库 实 现 的 描述 的 过 程 ， 
它 描述 基本 表 、 文 件 的 组 织 、 用 于 获得 有 效 访问 的 索引 以 及 所 有 与 完整 性 约束 和 安全 性 限制 
有 关 的 说 明 。 

Primary index ( 主 索引 ): 在 文件 的 有 序 键 字段 上 构建 的 索引 。 一 个 文件 最 多 可 以 有 一 个 
主 索引 或 一 个 群集 索引 。 有 序 键 用 于 保证 在 每 个 记录 中 有 一 个 唯一 的 值 。 

Primary key (主键 ，BR 模 型 ): 用 来 标识 每 个 实体 的 出 现 的 候选 键 . 

Primary key (主键 ， 关 系 模型 ): 唯一 标识 表 中 记录 的 候选 键 . 

privileges〈 权 限 ): 允许 用 户 在 给 定 基本 表 或 视图 上 执行 的 操作 。 

Prototyping (构建 原型 ): 数据 库 应 用 程序 生命 周期 的 一 个 阶段 ， 包括 构建 数据 库 应 用 程 
序 的 工作 模型 。 

QBE (Query-by-Example ): 一 种 用 于 关系 DBMS 的 非 过 程 化 的 数据 库 语 言 。QBE 是 一 个 
图 形 化 的 “点 - 按 ” 查 询 数 据 库 的 方法 。 

RDBMS: 关系 型 DBMS 。 

Record (记录 ): 同 tuple。 

Recovery control (恢复 控制 ): 当 失 败 时 ， 将 数据 库 还 原 到 正确 状态 的 过 程 。 

Recursive relationship (递归 关系 ): -一 种 关系 ， 当 同 一 个 实体 在 不 同 的 角色 中 参与 多 次 时 
' 就 会 出 现 递归 关系 。 例 如 ， Staff Supervises Staff 。 

Redundant data (元 余数 据 ): 在 多 个 表 中 存储 的 重复 数据 。 

Referential integrity (参照 完整 性 ): 如 果 一 个 表 中 存在 外 键 ， 则 外 键 值 必须 与 主 表 中 的 
某 些 记录 的 候选 键 键 值 相同 ， 或 者 外 键 值 必 须 全 部 为 空 。 

Relation (关系 ): 具有 有 列 和 行 的 表 。 

Relational model (关系 模型 ): 以 表 (或 关系 ) 的 形式 表示 数据 的 数据 模型 。 

Relational database (关系 数据 库 ): 规范 化 的 表 的 集合 。 

Relationship (关系 ): 实体 间 有 意义 的 关系 。 
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Relationship occurrence (关系 出 现 ): 两 个 实体 出 现 之 间 的 唯一 可 标识 的 联系 。 

Replication (复制 )， 在 一 个 或 多 个 站 点 上 产生 数据 的 多 个 拷贝 的 过 程 。 

Requirements collection and analysis ( 需求 收集 与 分 析 ): 数据 库 应 用 程序 生命 周期 的 一 
个 阶段 ， 包 括 收 集 和 分 析 数 据 库 应 用 程序 所 要 支持 的 关于 公司 的 信息 ， 并 使 用 这 些 信息 来 标 
识 新 的 数据 库 应 用 的 需求 。 

Row ( 行 ): 同 元 组 (tuple )。 

Second normal form (第 二 范式 ，2NF): 一 个 已 经 是 第 一 范式 的 表 ， 同 时 满足 所 有 的 非 主 
键 列 只 能 从 构成 主键 的 全 部 列 中 获得 。 

Secondary index (二 级 索引 ): 在 数据 文件 的 非 有 序 字 段 上 定义 的 索引 。 

Security (安全 ): 指 防止 数据 库 被 非 授权 的 用 户 访 问 ， 包 括 有 意 的 或 无 意 的 。RDBMS 通 
常 提 供 两 种 类 型 的 安全 : 数据 安全 和 系统 安全 。 

Server (服务 器 ): 为 发 出 请 求 的 客户 提供 服务 的 软件 应 用 程序 。 参 见 两 层 /三 层 客 户 端 -~ 
服务 器 体系 结构 。 

Simple attribute ( 简单 属性 ): 只 有 一 个 组 件 的 属性 。 

Single-valued attribute ( 单 值 属性 ): 对 于 一 个 实体 出 现 只 有 一 个 值 的 属性 。 

Specialization ( 特 化 ): 通过 标识 用 来 区 分 实体 间 成 员 的 特征 来 最 大 化 实体 间 成 员 的 差别 

Specialization hierarchy( 特 化 层次 结构 ): 同 type hierarchy。 

SQL (Structured Query Language, 结构 化 查询 语言 ): 一 种 用 于 RDBMS 的 非 过 程 化 数据 
库 语 言 。 换 言 之 ， 你 只 需 指定 你 需要 哪些 信息 ， 而 不 需要 指定 如 何 得 到 这 些 信息 。SQL 已 经 
被 国际 标准 化 组 织 (ISO) 标准 化 了 ,因此 SQL 是 定义 和 操纵 RDBMS 的 正式 的 和 实际 上 的 标 
准 语言 。 

Strong entity ( 强 实体 ): 一 个 不 依赖 于 其 他 实体 的 主键 的 存在 而 存在 的 实体 。 

Subclass ( 子 类 ): 为 ( 超 类 ) 实体 中 的 某 些 出 现 并 保持 特定 属性 和 关系 并 有 不 同 角色 的 
实体 。 

Superclass ( 超 类 ): 为 实体 中 的 所 有 出 现 保存 公共 属性 和 关系 的 实体 。 可 参见 
specialization 和 generalization 。 

Superkey ( 超 键 ，ER 模 型 ): 一 个 属性 或 属性 集 ， 唯 一 地 标识 了 每 个 实体 的 出 现 。 

Superkey 〈 超 键 ， 关 系 模型 ): 一 个 列 或 者 列 集 ， 唯 一 地 标识 了 表 中 的 一 个 记录 。 

System catalog (系统 目录 ): 保存 关于 数据 库 的 结构 、 用 户 、 应 用 程序 等 信息 的 数据 。 

System definition (系统 定义 ): 数据 库 应 用 生命 周期 中 的 一 个 阶段 ， 包 括 定义 数据 库 应 
用 程序 以 及 它 的 主要 用 户 视图 的 范围 和 边界 。 

System security (系统 安全 ): 在 系统 级 保护 数据 库 的 访问 和 使 用 ， 比 如 用 户 名 和 密码 。 

Table ( 表 ): 同 relation。 

Table diagram ( 表 图 ): 在 数据 库 (包括 主键 和 外 键 ) 中 对 表 的 图 形 化 的 表示 。 

Ternary relationship (三 元 关系 ): 三 个 实体 间 的 关系 。 例 如 ，Branch、 Staff 和 Member 间 
的 Registers 关 系 。 


Testing (测试 ): 数据 库 应 用 生命 周期 的 一 个 阶段 ， 包 括 执行 应 用 程序 并 有 意 地 发 现 错 
误 。 
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CCC 
Third normal form (第 二 范式 ，3NF): 一 个 已 经 是 INF 和 2NF 的 表 ， 同 时 满足 所 有 的 非 主 
键 列 的 值 仅 能 从 主键 列 得 到 ， 而 不 能 从 其 他 列 得 到 。 
Third-Generation Language (第 三 代 语 言 ，3GL ): 一 种 过 程 化 的 语言 ， 比 如 COBOL、C、 
C++， 它 需要 用 户 (通常 是 程序 员 ) 指定 必须 要 干什么 事情 以 及 如 何 干 这 些 事情 。 
Threat (威胁 ): 有 意 的 或 无 意 的 可 能 会 影响 系统 并 进而 影响 企业 的 情况 或 事件 。 
Three-tier client-server architecture (三 层 客户 端 -服务 器 体系 结构 )， 由 处 理 用 户 界面 的 
客户 和 处 理 业务 逻辑 的 应 用 程序 服务 器 以 及 数据 处 理 层 组 成 ， 而 数据 库 服务 器 是 用 来 运行 
DBMS 的 。 


实体 和 数据 间 的 关系 开始 这 个 顶层 的 步骤 ， 然后 逐步 添加 细节 ， 比如 你 希望 保存 的 关于 实体 
和 关系 的 信息 ( 称 为 属性 ) 以 及 在 实体 、 关系 和 属性 上 的 所 有 约束 。 

Transaction (事务 ): 由 用 户 或 应 用 程序 执行 的 一 个 动作 或 一 系列 动作 ， 这 些 动 作 访 问 或 
修改 数据 库 的 内 容 。 

Transaction Processing Monitor (事务 处 理 监 视 器 ，TPM): 控制 数据 在 客户 端 和 服务 器 间 
转换 的 程序 ， 以 便 为 联机 事务 处 理 (OLTP) 提供 一 个 一 致 的 环境 。 

Transitive dependency (传递 依赖 )， 假 设 A、B C 是 表 中 的 列 ， 如 果 B 依 赖 于 A (A-—B), 
并 且 C 依 赖 于 B (BC)， 则 C 通 过 B 传 递 而 依赖 于 A (假设 A 不 依赖 于 B 或 C )。 如 果 在 主键 上 
存在 一 个 传递 依赖 ， 则 此 表 就 不 是 3NF 的 。 必须 从 表 中 去 掉 传 递 依 赖 以 达到 3NF 的 要 求 。 

Tuple (元 组 ): 关系 中 的 一 行 记录 。 

Two-tier client-server architecture (两 层 客户 端 -服务 器 体系 结构 ): 由 处 理 主要 业务 和 数 
闫 处 理 远 辑 以 及 与 用 户 的 接口 的 客户 端 应 用 程序 和 管理 和 控制 数据 库 访问 的 服务 器 程序 组 成 

Type hierarchy (类 型 层次 结构 ): -一 人 实体 以 及 它 的 子 类 和 它们 的 超 类 ， 等 等 。 

UML (Unified Modeling Language， 统一 建 模 语言 ): 在 20 世 纪 80 年 代 和 90 年 代 引 入 的 诸 
多 面向 对 象 分 析 与 设计 方法 中 的 一 种 较 新 的 方法 。 

Update anomalies (更 新 异常 ): 当 用 户 试图 更 新 一 个 包含 元 余数 据 的 表 时 可 能 引起 的 不 
一 致 。 有 三 种 类 型 的 异常 :插入 、 删除 和 更 新 。 

User view ( 用户 视图 ): 从 特定 的 工作 (比如 经 理 或 管理 者 ) 或 业务 应 用 领域 (比如 市 场 、 
职员 或 库存 控制 ) 角度 定义 的 数据 库 应 用 的 需求 。 . 

View (视图 ): 一 个 “虚拟 的 表 ”， 它 不 实际 存在 在 数据 库 中 ， 但 它 由 DBMS 从 视图 所 涉 
及 的 基本 表 中 产生 。 

View integration approach (视图 集成 方法 ， 用 于 数据 库 设计 ): 每 个 用 户 视图 的 需求 ， 用 
来 构建 代表 用 户 视图 的 独立 数据 模型 。 在 数据 库 设 计 阶段 ， 结果 数据 模型 被 合并 成 一 个 更 大 
的 模型 。 

Weak entity ( 弱 实 体 ): 一 个 其 主键 部 分 或 完全 依赖 于 某 些 其 他 实体 的 存在 而 存在 的 实体 

XML (eXtensible Markup Language， 可 扩展 标记 语言 ): 一 个 能 够 使 设计 者 创建 自 己 定 
制 的 标记 的 元 语言 (描述 其 他 语言 的 语言 )， 提供 了 HTML 不 具有 的 功能 。 
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